اطلاعات صدا و تصویری که در حال حاضر از منابع بیشماری در سراسر دنیا در دسترس می باشد چه از حیث مقدار و چه تنوع و کیفیت طی روندی غیرقابل کنترل ازدیاد می یابد این اطلاعات در شکل های متعددی که اصطلاحا media نامیده می شود دسته بندی می گردد، عکس، طرح های گرافیکی (graphic) مدلهای سه بعدی (3D) خروجی های صبا (Audia) سیستم های صوتی، مکالمه و خروجی های تصویر سیستم های تصویری (Video) مهمترین media مدنظر می باشد و سیستمی که تقریبا تمام این اطلاعات را بعنوان ورودی بپذیرد multi – media تلقی می گردد در جامعه کنونی ما اطلاعات صدا و تصویر سوای اینکه در چه قالبی (media) قرار داشته باشد (فیلم، نوار مغناطیسی) یا اینکه بطور زنده Live یا real time و با ساختاری آنالوگ یا دیجیتال از سنسورهای تصویری یا صوتی پدید آمده باشند نقش مهمی را برعهده دارند ما با این که اطلاعات صدا و تصویر بواسطه انسان از بین می رود و حالات رو به افزایشی نیز وجود دارد که بواسطه سیستم های پردازشگر اطلاعات جدیدی طی فرآیندهای خاص خلق، تبدیل و بازیابی می گردند. دیگر موردی که اطلاعات صوتی و تصویری بعنوان پایه تلقی می گردند تحت عنوان سناریوی مهم تصویر I maye understandy می باشد این موضوع مورد توجه سیستم های حفاظتی دوربین های هوشمند و سیستم های تصویری جاسوسی می باشد تبدیل محتوا یا اصطلاحا media conversion موضوع اصلی می باشد (تبدیل های صحبت بستن، تصویر به صحبت، صحبت به تصویر و مثال هایی از فرآیند فوق می باشد.) retrieval دیگر سناریوی که این استاندار دربر می گیرد بازیابی مجدد اطلاعات و گزینش اطلاعات filtering بر روی دنباله ای از محتوای صدا و تصویر می باشد.
(بازیابی مبتنی بر جستجوی سریع و کارآمد انواع متعدد اسناد مالتی مدیا مورد علاقه کاربرگزینشی مبتنی بر پذیرش صرفا عناوین داده های مالتی مدیای قانع کننده الویت های مدنظر کاربربرای مثال در یک برنامه تلویزیونی کد تعریف شده خاصی می تواند دستگاه VCR ای را که از قبل به منظور ضبط برنامه موردنظر برنامه ریزی شده است فعال نماید یا اینکه سنسور تصویری خاص هنگامی که یک رویداد مشخص واقع گردد سیستم اخطار را بکار بیاندازد. با بهره گیری از کدگذاری انتقالی خودکار (Auiomatic ranscodeing) ذخیره ای از کاراکترها را به اطلاعات قابل شنیدن ترجمه نمود و یا اینکه عملیات جستجو را در زنجیره ای از اطلاعات صوتی تصویری اجرا نمود. در تمامی مثال هایی که ارایه دهد اطلاعات صدا و تصویر به طرزی مناسب دستگاه خاصی device را فعال کرده یا برای تحقق عملکردی به یک کد کامپیوتری ترجمه شده اند. Voice tag در گویش های موبایل امروزه برای شماره گیری بکار می رود . در زندگی امروزه ما منابع صوتی تصویری نقش بسزا و فراگیری را برعهده دارند و همواره نیاز به داشتن منابع پردازش شده فوق در آینده روند رو به رشدی را می نمایاند. همین مطلب مؤید نیاز به نمایش نظیر قالب های توسعه یافته نمایشی از اطلاعات صوتی تصویری ورای قالب های معمول شکل موج های : ساده، نمونه برداری شده، مبتنی بر فشرده سازی (MPEG 1, 2) یا حتی شی ء محور (PEG 4) – Object – based می باشد. نیاز به قالب های نمایشی که درجه ای از تغییر و تبیین معنی سازی اطلاعات را ممکن سازد کاملا احساس می شود لذا امکان عبور یا دسترسی این قالب های نمایشی بواسطه هر دستگاه موردنظر یا یک کد کامپیوتری فراهم خواهد شد. در مثال هایی که اخیرا درمورد کاربرد MPEG 7 بیان شد اگر داده های تصویری تولید شده سنسور تصویری را ملاحظه کنیم دیگر در قالب نمونه های PCM متعارف pixel rulues نبوده بلکه در قالب یک شیء با ابعاد فیزیکی انحصاری و اطلاعات زمانی مربوطه مطرح می باشد این اطلاعات را می توان ذخیره نمود تا چنانچه شرایط برنامه ریزی شده خاصی محقق گردید بمنظور رسیدگی صحت و انطباق آن با موضوع موردنظر پردازش شوند. یک دستگاه ضبط تصویر قادر خواهد بود توضیحی در رابطه با اطلاعات صوتی تصویری متناظر با یک برنامه را بعنوان فرمان بپذیرد و بواسطه آن با مواجهه با چنین برنامه ای فورا سیستم ضبط را فعال سازد. برای مثال توضیح می تواند ] فقط خبر به غیر از خبر ورزشی[ باشد. MPEG – 7 استانداردی به منظور توصیف داده های محتوایی مالتی مدیا خواهد بود بطوریکه بتواند نیازهای کاربردی را پشتیبانی کنند. نیازمندیهای لازم برای بکارگیری این استاندارد در حالت Real – time و non – real time (on/off line) یکی می باشد. باید توجه شود که اساسا گروه MPEG کاربردها را بررسی یا استاندارد نمی کند لیکن این اسناد و مدارک تحت عنوان معرفی استاندارد MPEG 7 براساس گستره وسیعی از کاربردهایی است که می تواند حیطه این استاندارد را شکل دهد. عناصر اصلی استاندارد MPEG-7 عبارتند از :
توصیف گر که با نماد D حرف اول Discriptor نشان داده می شود. شیوه توصیف : Discription scheme (DS) مشخص کردن سازگان و معانی روابط مابین مؤلفه های ماده دیداری – شنیداری موردنظر توصیف گر. زبان تعریف توصیف Discription Definition (DDL) ابزارهای سیستم (system tools) وظیفه این ابزارها تامین تلفیق (مالتی پلکس) توصیف ها با محتوا، ساماندهی همزمانی توصیف و جایگیری مناسب آن در کنار محتوا، تمهید مکانیزم های انتقالی، کدگذاری، ذخیره سازی و مدیریت و تاکید قابل معنی بودن توصیف ها می باشد. عملکرد استاندارد MPEG-7 برای هر دو نوع اطلاعات ذخیره شده یا جاری و در محیط non-real time/real time تضمین شده است محیط real time بدین مضموم اشاره دارد که پارامترهای توصیفی همگام با دسترسی آنی به محتوا تولید و قابل استفاده خواهند بود. شکل یک بلوک دیاگرام خلاصه ای در رابطه با زنجیره فرآیند کاربری استاندارد MPEG-7 را نشان میدهد. این زنجیره سه بخش اصلی فرآیند را نشان می دهد:
استخراج پیکربندی (an alysis) توصیف (MPEG-7) موتور جستجو (application) استخراج خودکار توصیف ها (descriptor) لذا اهمیت فوق العاده ای برخوردار است. واضح است که همیشه این استخراج اتوماتیک میسور نمی باشد لیکن چنانچه متذکر شویم به منظور دست یابی به سطح بالایی از اختصار محتوا نیازمند پیچیدگی بیشتر استخراج اتوماتیک خواهد بود. و لذا استفاده از ابزارهای استخراجی دوطرفه (interactive) توصیه میشود. شکل های 2 و 3 فهم بهتری را از عملکرد توصیف گر شیوه توصیف و DDL فراهم می کنند. با استناد به نمودار 2، DDL مکانیزمی را جهت بنا شیوه توصیف فراهم می کند. شکل شماره 3 زنجیره فرضی استاندارد MPEG-7 را در عمل شرح می دهد. بلوک های دایره ای شکل معرف واحدهای عملگر (نظیر کدر، دیکدر) و بلوک های مربعی معرف عناصر باصطلاح استاتیک (نظیر توصیف گر) می باشند. نهایتا در شکل فوق عناصر اصلی با بلوکهای احاطه شده توسط نقطه چین ارایه شده است. تاکید استاندارد MPEG-7 تدارک راه حل های نو و بدیعی برای توصیف محتواهای دیداری شنیداری می باشد. بدین سبب صرفا آدرس دهی (addressing) متنی جزو اهداف MPEG-7 نخواهد بود. البته لازم تذکر است که علاوه بر اطلاعات صوتی و تصویری امکان ارجاع دادن به یک متنی توصیفی نیز دور از انتظار نیست و غالبا استاندارد MPEG-7 راه حل هایی ارایه شده برای توصیف های متنی توسط سایر ارگان های متولی استاندارد مدنظر خود قرار می دهد.
ناحیه کاربردی MPEG-7
جمله عواملی که وظیفه تعیین استاندارد MPEG-7 را برعهده دارند گستره وسیعی از کاربرها می باید مدنظر قرار دهند (کاربردهایی نظیر کتابخانه های دیجیتالی مالتی مدیا انتخاب رادیو تلویزیون یا هر مدیای بروکاست تدریس مالتی مدیا وسایل سرگرمی مالتی مدیای خانگی و ...) MPEG-7 در آینده شبکه ای web را ایجاد می کند با قابلیت جستجوی مالتی مدیا شبیه آنچه امروز با قابلیت جستجوی متن در اینترنت دراختیار هست. از نکات جالب توجه این استاندارد کاربران ویژه برای آرشیوهای مالتی مدیای با حجم بزرگ برای عامه می باشد بطوری که مصرف کننده محصول مالتی مدیا (با حجم متنابه) امکان دسترسی به محتوای آن را نظیر یک کاتالوگ جهت معرفی آنچه خریداری کرده است دراختیار دارد. یکی از موارد استفاده اطلاعات ایجادی این استاندارد در زمینه برودکاست می باشد انتخاب فیلتر مواد شنیداری دیداری یا حتی تبلیغات شخصی توسط کاربرد که توسط عامل مرتبط تحقق می پذیرد ازین جمله می باشند. البته درحال حاضر تجسم چگونگی استفاده از استاندارد فوق در زمینه های متنوع کار آسانی نیست لیکن تاحدودی می توان با ارایه مثال هایی حس لازم را برای آشنایی بهتر با این استاندارد مطابق زیر فراهم کنیم: معماری، وضعیت حقیقی و طراحی داخلی (بعبارت دیگر جستجو برای منظوری خاص) انتخاب مدیا دیداری و شنیداری برودکاست (بخش فراگیر) سرویس های فرهنگی (موزه های تاریخ، کالری های هنری و ...) کتابخانه های دیجیتالی (کاتالوگ تصویری، دیکشنری موزیکال، کاتالوگهای تصویربرداری مهندسی پزشکی) آرشیوهای رادیو، ویدیو وفیلم.