820 بازدید

تلفیق ویژگیهای معنایی و دیداری در یک سیستم تعاملی بازیابی تصویر

این مطلب بخشی از یکی از فصل های دانلود پایان نامه بازیابی تصویر براساس محتوا – پردازش تصویر است .

در سالهای اخیر تلاشهای زیادی برای ایجاد روشهایی کارآمد در بازیابی تصویر بر پایه محتوی شده است. این تلاشها منجر به ساخت سیستمهای متفاوتی در بازیابی تصویر شده است. اساس کار این سیستمها بر این استوار است که تصاویر را بر پایه مجموعه­ای از ویژگیهای دیداری سطح پایین آنها مثل رنگ، شکل، بافت و چیدمان رنگ ارائه و نمایه­ سازی کنند. بازیابی با مقایسه ویژگیهای تصویر پرس و جو با نمایه­های تصاویر پایگاه و تعیین شبیه­ ترین تصاویر انجام می­شود.

بازیابی تصویر براساس محتوا - پردازش تصویر

عموماً کاربران هنگام پرس و جوی تصویر به ویژگیهای سطح پایین تصویر توجهی ندارند و ویژگیهای سطح بالا یا همان ویژگیهای معنایی را در نظر می­گیرند. در این مورد اغلب سیستمهای بازیابی تصویر، عملکرد ضعیفی دارند. این ضعف بخاطر فاصله­ای است که بین ویژگیهای دیداری سطح پایین و ویژگیهای معنای سطح بالا وجود دارد و به فاصله معنایی مشهور است  . بنابراین، تحقیقات اخیر در این زمینه سعی بر تلفیق ویژگیهای معنایی و ویژگیهای سطح پایین دارند. برای این منظور، محققان بر آن شده­اند که از بازخورد ارتباط و طبقه­بندی معنایی تصاویر استفاده کنند.

در استفاده از بازخورد ارتباط ، کاربر و کامپیوتر تارسیدن به تصاویر دلخواه کاربر با یکدیگر تعامل دارند. این تعامل به سیستم کمک می­کند تا ارتباطی معنی­دار بین ویژگیهای سطح پایین و ویژگیهای سطح بالا برقرار کرده و فاصله معنایی را کاهش دهد. در فرآیند بازخورد ارتباط، سیستم باید وزنهای مربوط به ویژگیهای متفاوت را بیاموزد تا بتواند کاربر را در رسیدن- سریع و دقیق- به اهدافش کمک کند. همچنین، یادگیری پرس و جوی مورد نظر کاربر نیز یکی از اهداف مهم استفاده از بازخورد ارتباط است که کمک شایانی به سرعت و دقت سیستم می­کند.

در اکثر سیستمهای تعاملی، هدف از بازخورد ارتباط یادگیری مفاهیم دلخواه کاربری است که در همان لحظه با سیستم کار می­کند. در این سیستمها، چنانچه کاربر عوض شود یا آنکه تصویر پرس و جوی خود را تغییر دهد، اطلاعاتی که در پرس و جوی قبلی به سیستم وارد شده است، از بین رفته و استفاده نمی­شود. به عبارت دیگر، اکثر سیستمهای تعاملی از بازخورد ارتباط تنها برای یادگیری کوتاه مدت بهره  می­جویند در چنین سیستمهایی، اطلاعات ایجاد شده در تعامل کاربران قبلی و سیستم که می­تواند در بازیابی­های بعدی مفید و موثر واقع شود، به فراموشی سپرده می­شود. جمع­آوری دانش تولید شده در بازیابی­های دوره های قبل برای بازیابی­های آینده، یادگیری بلند مدت نامیده شده است .


[box type=”tip” font=”tahoma” float=”right”]برای دریافت نسخه متنی(کامل تمامی فصل ها با جزییات کامل ) آن Word و منابع به کار رفته و مقالات موجود در سایت فارسی و انگلیسی (اصل مقالات فارسی و انگلیسی ) پایان نامه بازیابی تصویر براساس محتوا – پردازش تصویر و مراجع مبلغ ۶۰۰.۰۰۰ ریا ل – معادل شصت هزار تومان را به یکی از شماره کارت های زیر واریز نمایید و اطلاعات پرداخت را از طریق بخش تماس با من-(شماره تماس من پیامک کنید) ارسال نمایید. و یا از طریق پرداخت انلاین سایت به صورت آنی از طریق شبکه شاپرک به صورت اینترنتی واریز نمایید تا لینک دانلود ارسال شود.

 

بانک ملی به نام مهدی فعال۱۶۰۶ – ۰۶۷۱ – ۹۹۱۸ – ۶۰۳۷ : و شماره شبا IR-91 017 000 000 010 930 580 2008

بانک سپه به نام مهدی فعال: ۷۹۸۶– ۷۳۵۰- ۱۰۱۰ – ۵۸۹۲ و شماره شبا IR32 0150 0000 0090 2300 3002 01[/box]

 

۴-۲-      سیستم تعاملی پیشنهادی برای بازیابی معنایی تصویر
بلوک دیاگرام سیستم پیشنهادی در شکل ۴-۲ آمده است. این سیستم از جنبه­ های متفاوت قابل بررسی است. قبل از آنکه به بررسی آن از زوایای مختلف پرداخته شود، لازم است که بلوکهای آن بطور مختصر معرفی شوند.

۴-۲-۱-    پایگاه تصویر
این بلوک شامل تصاویر پایگاه است. به عبارت دیگر، این بلوک شامل تصاویری است که کاربر برای یافتن تصویر دلخواهش آنها را جستجو می­کند. در سیستم پیشنهادی برای اهداف یادگیری که بعداً به آن پرداخته می­شود، تعداد اندکی از تصاویر پایگاه برچسب زده می­شوند، عمل برچسب زنی را یک فرد خبره انجام می­دهد. با این کار گروه معنایی بخشی از تصاویر مشخص می­شود. به عبارت دیگر، از هر گروه معنایی تعدادی تصویر به سیستم معرفی می­شود. این تصاویر در بلوک “انتخاب تابع شباهت و وزن­دهی ویژگیها” به عنوان تصاویر مجموعه یادگیری استفاده می­شوند.

۴-۲-۲-    پایگاه ویژگیهای سطح پایین
از هر یک از تصاویر پایگاه، تعدادی ویژگی دیداری استخراج می­شود. ممکن است بسته به نوع پایگاه تصویر، ویژگیهای دیداری متفاوتی استخراج شود. بطور معمول، در بازیابی تصویر لازم است که ویژگیهای مناسبی برای توصیف خواص رنگ، شکل و بافت تصاویر استخراج شود. ویژگیهای استخراج شده از تصاویر در پایگاه ویژگیهای سطح پایین نگهداری می­شوند. از آنجایی که برچسب معنایی تعدادی از تصاویر مشخص شده است، پایگاه ویژگیهای سطح پایین نیز به دو بخش تقسیم می­شود، بخشی متعلق به تصاویر برچسب خورده و بخش دیگر متعلق به تصاویر برچسب نخورده است.

۴-۲-۳-    انتخاب تابع شباهت و وزن­دهی ویژگیها
تابعی که با استفاده از آن شباهت بین دو تصویر بر اساس ویژگیهای دیداری آنها سنجیده می­شود، نقش بسزایی در دقت بازیابی و طبقه­بندی دارد. از وظایف این بلوک، انتخاب تابع شباهت بهینه برای هر یک از انوع ویژگی است.

تعیین نقش هر یک از ویژگیها و نیز وزن­دهی هر یک از مولفه­های ویژگی برای رسیدن به بالاترین نرخ طبقه­ بندی در مجموعه ویژگیهای برچسب خورده، دیگر وظیفه این بلوک است. بعبارت دیگر، وظیفه این بلوک تنظیم پارامترهای یک طبقه­بند با استفاده از تصاویر برچسب خورده است که در اینجا تصاویر برچسب خورده به عنوان تصاویر مجموعه یادگیری بکار گرفته می­شود.

۴-۲-۴- طبقه­ بند فازی
پارامترهای این طبقه­ بند با استفاده از مجموعه تصاویر برچسب خورده، در بلوک “انتخاب شباهت و وزن­دهی ویژگیها” تنظیم می­شوند. این طبقه­ بند باید مجموعه تصاویر برچسب نخورده را به گروههای معنایی مختلف طبقه ­بندی کرده و میزان تعلق هر یک از تصاویر این مجموعه را به گروههای معنایی تعیین کند. منظور از ویژگی معنایی، تعلق یا عدم تعلق هر یک از تصاویر به هر یک از گروههای معنایی است، پرواضح است که ویژگی معنایی تصاویر برچسب نخورده مشخص نیست. بنابراین با استفاده از طبقه ­بندی فازی می­توان برای هر یک از این تصاویر، درجه تعلقی به گروههای معنایی نسبت داد.

۴-۲-۵-    پایگاه ویژگیهای معنایی
در این پایگاه، اطلاعات مربوط به تعلق یا عدم تعلق هر تصویر به گروههای متفاوت به عنوان ویژگی معنایی آن موجود است. اطلاعات این پایگاه به جستجوی سریعتر و دقیقتر پایگاه تصویر در تعامل با کاربر کمک فراوانی می­کند. برای هر تصویر، خروجی طبقه ­بند فازی به عنوان ویژگی معنایی اولیه در نظر گرفته می­شود. این ویژگیها در فرآیند تعامل کاربران مختلف یا سیستم تصحیح می­شوند. اطلاعات مربوط به میزان تعلق تصاویر پایگاه به گروهها مختلف در یک جدول به نام جدول معنایی قرار می­گیرد.

پایان نامه بازیابی تصویر براساس محتوا – پردازش تصویر

۴-۲-۶- پرس و جوی معنایی
در بخش ۲-۲-۴ روشهای برقراری ارتباط بین کاربر و سیستم مطالعه شد. در سیستم پیشنهادی کاربر از طریق پرس و جوی معنایی با سیستم ارتباط برقرار می­کند. در این سیستم فرض شده است که تعداد گروههای معنایی مشخص هستند. بنابراین کاربر در شروع جستجو به سیستم اعلام می­کند که تصاویر دلخواهش به کدام گروه معنایی تعلق دارند. سیستم در پاسخ به تقاضای کاربر ، تعدادی از تصاویر آن گروه را بطور اتفاقی به کاربر ارائه می­کند. سپس کاربر با اعلام نظر درباره این تصاویر، در قالب بازخورد ارتباط تعامل با سیستم را آغاز می­کند.

۴-۲-۷-     بازخورد ارتباط
بازخورد ارتباط با اعلام نظر کاربر نسبت به تصاویری که به او نشان داده شده است . آغاز می­شود. نظر کاربر راجع به تصاویر می­تواند به سیستم در رسیدن به آنجه دلخواه او است کمک قابل توجهی بکند. از این اطلاعات در قالب­های یادگیری کوتاه مدت و یادگیری بلند مدت استفاده می­شود. هدف از یادگیری کوتاه مدت، یادگیری تصویر دلخواه کاربر در خلال یک عمل بازیابی است . با جمع­ آوری اطلاعات ایجاد شده در مراحل متعدد بازیابی، دانشی ایجاد می­شود که به استخراج ویژگیهای معنایی از تصاویر کمک می­کند. این عمل در قالب یادگیری بلند مدت انجام می­شود.

۴-۲-۸-     یادگیری کوتاه مدت
در سیستم پیشنهادی پرس و جو از نوع اتفاقی است. یعنی اینکه سیستم چند تصویر را بصورت اتفاقی به کاربر ارائه می­کند و کاربر با اعلام نظر راجع به این تصاویر در بازیابی تصویر دلخواهش به سیستم کمک می­کند. در این نوع بازیابی، در اولین مرحله سیستم باید با توجه به اطلاعاتی که کاربر راجع به تصاویر اعلام می­کند، یک پرس و جوی فرضی ایجاد کند. البته این پرس و جوی فرضی در ادامه عمل بازیابی و در مراحل بعدی تصحیح می­شود یا بهبود می­یابد.

پس از ساخته شدن پرس وجو، سیستم می­تواند پایگاه ویژگیها دیداری را برای یافتن تصاویر نزدیک به تصویر پرس و جو، جستجو کند. برای این منظور به یک تابع شباهت نیاز است . در اولین مرحله سیستم از پارامترهای بهینه شده در مرحله طبقه ­بندی استفاده می­کند. سپس این فاصله در مراحل بعدی بازیابی بهبود می­یابد.

۴-۲-۹-    یادگیری بلند مدت
اشاره شده که در سیستم پیشنهادی، از ویژگی معنایی در کنار ویژگی­های دیداری برای بهبود سرعت و دقت بازیابی استفاده شده است. این ویژگیها با استفاده از طبقه­ بندی ایجاد می­شود و با باز خورد ارتباط در قالب یادگیری بلند مدت، تصحیح می­شوند. با جمع­ آوری اطلاعات ارائه شده توسط کاربران مختلف هنگام کار با سیستم، دانشی غنی راجع به ویژگیهای سطح بالای تصاویر استخراج می­شود. به عبارت دیگر، هدف از یادگیری بلند مدت استخراج اطلاعات مربوط به ویژگیهای سطح بالای تصاویر در خلال بازیابی­های متعدد است.

۴-۳-     بررسی سیستم از زوایای مختلف
در بخش اول، به معرفی مختصر بلوکها و مفاهیم اساسی بکار رفته در بلوک دیاگرام سیستم پیشنهاد پرداخته شد. در این بخش به معرفی کلی این سیستم از زوایای مختلف پرداخته می­شود.

۴-۳-۱-  سیستم از دید کاربر
در این سیستم، کاربر جستجوی خود را بصورت معنایی آغاز کرده و با اعلام نظر راجع به تصاویر ارائه شده آن را ادامه می­دهد. نکته بارز این سیستم این است که بر خلاف بسیاری از سیستمهای تعاملی دیگر، کاربر هیچ نیازی به داشتن دانش راجع به ویژگیهای دیداری ندارد. به عبارت دیگر، کاربر فقط بر اساس اینکه معنای تصاویر ارائه شده به تصویر دلخواهش نزدیک است یا خیر، اعلام نظر کرده و به ویژگیهای سطح پایین آنها نمی­اندیشد. بنابراین، این سیستم با شرایط فکری انسانها که به معنای تصاویر فکر می­کنند، سازگار است و با در نظر گرفتن این فرض، با کاربران در تعامل است. شکل ۴-۳ ، سیستم تعاملی ، پیشنهادی را از دید کاربر به تصویر کشیده است.

۴-۳-۲-    سیستم از دید یادگیری
سیستم سعی می­کند که فاصله معنایی بین ویژگیهای سطح پایین و سطح بالا را پرکرده و نیز هر چه سریعتر و دقیقتر به نیاز کاربر پاسخ دهد. برای رسیدن به مقاصد ذکر شده، تلفیق ویژگیهای معنایی و دیداری به عنوان راهکاری مناسب پیشنهاد شده است. ذکر این نکته ضروری به نظر می­رسد که در تلفیق ویژگیهای معنایی و دیداری و بازیابی معنایی تصویر، مشکل اصلی استخراج ویژگیهای معنایی است. برای رفع این مشکل، از طبقه­بندی و یادگیری بلندمدت استفاده شده است. در این سیستم، از طبقه­بندی برای استخراج معانی تصاویر استفاده شده است. بنابر این، اولین مرحله از یادگیری، طراحی یک طبقه­بندی است که با استفاده از ویژگیهای دیداری تصاویر بتواند معانی آنها را استخراج کند. از انجایی که در یک پایگاه بزرگ تصویر، تعداد معانی زیاد است و نرخ خطای طبقه­بندی زیاد خواهد شد، تصحیح ویژگیهای معنایی ایجاد شده توسط طبقه­بند در خلال کار کاربران تحت عنوان یادگیری بلند مدت استفاده از بازخورد ارتباط در نظر گرفته شده است. ترکیب طبقه­بندی و یادگیری بلند­مدت، منجر به تولید ویژگیهای معنایی مطمئن برای تصاویر می­شود.

یادگیری مقصود یک کاربر خاص، در حین کار با سیستم، نوعی دیگر از یادگیری است که در سیستم دیده شده است.

از این نوع یادگیری با نام “یادگیری کوتاه مدت” یاد می­شود که در آن سعی می­شود پرس و جوی فرضی کاربر ساخته شده و بهبود داده شود. همچنین در این نوع یادگیری، وزن هر یک از ویژگیهای مختلف در تابع شباهت بکار رفته برای جستجوی پایگاه ویژگیهای دیداری، مشمول یاد گیری می­شود. این نوع یادگیری به “بهبود تابع شباهت” مشهور است.

۴-۳-۳-    سیستم از دید ویژگی
در سیستم فوق برای هر یک از تصاویر دو نوع ویژگی وجود دارد: ویژگیهای دیداری و ویژگیهای معنایی. با توجه به نوع پایگاه تصویر، ویژگیهای دیداری خاصی از تصاویر استخراج شده و در پایگاه ویژگیهای سطح پایین نگهداری می­شود.در عمل بازیابی، سیستم پایگاه تصویر را را بر اساس تلفیق ویژگیهای دیداری و معنایی جستجو می­کند. در این جستجو، ویژگیهای معنایی از اولویت برخوردارند. یعنی اینکه سیستم با دریافت یک پرس و جوی معنایی، تصاویری از پایگاه را جستجو می­کند که به گروه معنایی دلخواه کاربر تعلق داشته باشند. بنابراین، هرچه ویژگیهای معنایی معتبرتر باشند، دقت بیشتر خواهد بود.

در یک پایگاه بزرگ، تعیین ویژگیهای معنایی تصاویر دستی کاری سخت و زمان بر است. در این سیستم، ویژگیهای معنایی ابتدایی توسط یک طبقه­ بند فازی به تصاویر نسبت داده می­شوند و در خلال کار سیستم با بکارگیری یادگیری بلند مدت بهبود می­یابد.

۴-۳-۴-     سیستم از دید تکوین جدول معنایی
تکوین جدول معنایی در سه مرحله انجام می­شود. در مرحله اول، اطلاعات معنایی مربوط به تصاویر برچسب خورده در این جدول قرار می­گیرد که شامل تعلق انها به گروههای معنایی مختلف هستند. در مرحله دوم، تصاویر بر چسب نخورده، طبقه­ بندی شده و خروجی طبقه­ بند برای هر یک از انها به عنوان معنایی آن در نظر گرفته می­شود. برچسبهای معنایی تولید شده برای تصاویر این دسته، به عنوان ویژگی معنایی ابتدایی برای انها در نظر گرفته شده و جدول معنایی ابتدایی ایجاد می­شود. بر چسب معنایی تصاویر در خلال کار کاربران تصحیح شده و ویژگی معنایی هر تصویر استخراج می­شود. تصحیح جدول معنایی، مرحله سوم از تکوین جدول معنایی است.

۴-۳-۵-   سیستم از دید مراحل زمانی
این سیستم در چهار مرحله مرتبط بهم عمل می­کند که درادامه به ترتیب به انها پرداخته می­شود.

v     مرحله اول: بر چسب زنی دستی به بعضی از تصاویر

در این مرحله تعدادی از تصاویر گروههای معنایی مختلف پایگاه، بصورت اتفاقی انتخاب شده و به سیستم معرفی می­شوند. این عمل که در ادامه از آن به عنوان برچسب زنی به تصاویر یاد می­شود توسط یک فرد خبره و آگاه به پایگاه تصویر صورت می­گیرد.

v     مرحله دوم: طراحی طبقه­ بند

در این مرحله که بصورت برون خط ۱ است، بلوکهایی از شکل ۴-۲ درگیر هستند که ارتباط بین آنها با خطوط پهن توخالی مشخص شده است. این بلوکها عبارتند از: بلوک “پایگاه تصویر” بلوک “ویژگیهای سطح پایین “، بلوک”انتخاب تابع شباهت و وزن­دهی ویژگی ” و بلوک ” و بلوک طبقه­بندی فازی “. هدف از این مرحله آن است که با استفاده از تصاویر بر چسب خورده یک طبقه­بند برای برچسب زنی خودکار به تصاویر پایگاه ایجاد شود. خروجی این طبقه­بند برای تصاویر بر چسب نخورده به عنوان اطلاعات اولیه معنایی برای آن تصاویر در نظر گرفته می­شود. در طراحی طبقه بند، باید مفاهیم سطح بالای نهفته در تصاویر براساس ویژگیهای سطح پایین آنها به بهترین وجه آموخته شود. ۴-۴، بلوک دیاگرام مربوط به این مرحله را نشان می­دهد.
شکل۴-۴ بلوک دیاگرام مرحله طراحی طبقه بند

برای این منظور، چنانچه در شکل ۴-۲ مشاهده می­شود، تصاویر پایگاه به دو دسته تقسیم می­شوند. دسته اول، تعداد اندکی از تصاویر هستند که بر چسب معنایی آنها در مرحله اول به طور دستی مشخص  می­شود و به منظور انتخاب تابع شباهت مناسب و وزن­دهی مناسب ویژگیهای برای بهترین انطباق ویژگیها معنایی بر ویژگیهای سطح پایین در مرحله طبقه­بندی، استفاده می­شوند. اطلاعات بدست آمده از این قسمت، شامل اطلاعات مربوط به تاثیر نوع ویژگیها و نیز تاثیر نقش مولفه­های ویژگی در ارتباط با یادگیری بهتر مفاهیم معنایی در تنظیم پارامترهای طبقه­بند فازی، برای طبقه­بندی تصاویر بر چسب نخورده پایگاه تصویر و ایجاد ویژگی معنایی ابتدایی استفاده می­شود.

v     مرحله سوم: برچسب­زنی خودکار به تصاویر بر چسب نخورده و ایجاد جدول معنایی ابتدایی

مرحله سوم نیز مانند مرحله دوم بصورت برون خط انجام می­شود. بلوک دیاگرام این مرحله در شکل ۴-۵ آمده است.

در این مرحله، دسته دوم تصاویر- دسته اکثریت- که بر چسب معنایی آنها مشخص نیست، پس از استخراج ویژگی به طبقه­بندی فازی سپرده می­شوند. درجه تعلیق هر یک از تصاویر این دسته به گروههای معنایی متفاوت، پس از طبقه­بندی آنها مشخص می­شود. این اطلاعات به عنوان ویژگیهای معنایی اولیه تصاویر در نظر گرفته می­شوند (پیکانهای پهن توپر در شکل ۴-۲). اطلاعات مربوط به دره تعلیق هر یک از تصاویر پایگاه، اعم از برچسب نخورده به بلوک “ویژگیهای معنایی” سپرده می­شود. این اطلاعات در مرحله بازیابی بسیار مفید و ارزشمند هستند.
شکل ۴-۵ بلوک دیاگرام مرحله ایجاد جدول معنایی ابتدایی

 

همانطور که در اغلب سیستمها مرسوم است، در مواجهه با یک پرس و جو، ویژگیهای سطح پایین آن استخراج شده و پایگاه ویژگیهای سطح پایین برای یافتن نزدیکترین تصاویر به آن جستجو می­شود. حال اگر ویژگی معنایی تصاویرپایگاه مشخص باشد، برای یافتن نزدیکترین تصاویر به پرس و جو تنها تصاویری که ویژگی معنایی مرتبط با آن دارند، جستجو خواهند شد. این امر باعث افزایش سرعت و دقت بازیابی خواهد شد. البته این موضوع بسیار وابسته به این است که آیا ویژگیهای معنایی به درستی استخراج شده­اند یا خیر؟ حالتی را درنظر بگیرید که ویژگیهای معنایی، که در سیستم پیشنهادی با استفاده از یک طبقه­بند ایجاد  می­شوند، نا معتبر یا حتی اشتباه باشند، در این حالت، استفاده از ویژگیهای معنایی در کنار ویژگیهای سطح پایین نه تنها باعث افزایش دقت بازیابی نشده، بلکه باعث کاهش چشمگیر کارآیی آن نیز خواهد شد. استفاده از بلوک ” انتخاب تابع شباهت و وزن­دهی ویژگیها “، برای یادگیری هر چه بهتر مفاهیم سطح بالا بر اساس مفاهیم سطح پایین در طبقه­بند، به علت حساسیت بالایی است که اطلاعات معنایی ایجاد شده توسط   طبقه­بند دارد.

پایان نامه بازیابی تصویر براساس محتوا – پردازش تصویر

مهمترین دلیل استفاده از طبقه بند فازی، این است که این طبقه­بند، محتاطانه­تر از یک طبقه­بند غیرفازی عمل می­کند. طبقه­بند غیر فازی ، تصویر را به یک گروه معنایی اختصاص می­دهد و شانسی برای تعلق آن به گروه­های دیگر قائل نمی­شود. این در حالی است که طبقه­بند فازی، برای هر تصویر درجه­ای از تعلق به گروههای متفاوت قائل می­شود. بنابراین در این حالت شانس تخصیص کامل یک تصویر به گروهی که به آن تعلق ندارد کمتر شده و این فرصت ایجاد می­شود که این تصویر در بازیابی­های مربوط به گروه واقعی خود نیز شرکت کند. حال این سوال مطرح می­شود که چگونه می­توان پی­برد که هر یک از تصاویر پایگاه به کدام یک از گروههای معنایی تعلق دارند؟ به عبارت دیگر چگونه می­توان اطلاعات معنایی مربوط به هر تصویر را استخراج کرد؟ پاسخ به این سوال در سیستم پیشنهادی دیده شده است. سیستم با ویژگیهای معنایی ایجاد شده توسط طبقه­بند ، کار خود را آغاز کرده و در فرآیند بازیابی که در تعامل با کاربر انجام می­دهد، ویژگیهای معنایی مربوط به تصاویر را تصحیح می­کند. این عمل در سیستم ارائه شده، در فرآیند یادگیری بلند مدت انجام می­شود. یعنی اینکه با تعامل کاربران با سیستم ، اطلاعات مربوط به ویژگیهای معنایی تصاویر تصحیح می­شود. در این سیستم انتظار می­رود که رفته رفته با افزایش تعداد دفعاتی که کاربر با سیستم کار می­کند، دقت و سرعت بازیابی افزایش پیدا کند. این هدف در صورتی قابل تحقق است که ویژگیهای معنایی ایجاد شده توسط طبقه بند، به مرور تصحیح شده و در نهایت ویژگی معنایی نهفته در تصاویر استخراج شود. بعد از طبقه بندی تصاویر بر چسب نخورده، اطلاعات مربوط به میزان تعلق هر یک از آنها به گروههای منفاوت به همراه اطلاعات مربوط به تصاویر برچسب خورده در یک جدول قرار می­گیرد که به آن جدول معنایی گفته می­شود. به محض آنکه جدول معنایی ایجاد شود، سیستم می­تواند مرحله چهارم کار خود را که بصورت بر خط انجام می­شود، آغاز کند.

مرحله چهارم : پاسخگویی به نیاز کاربر

در این مرحله که به صورت برخط انجام می­شود، سیستم آماده پاسخگویی به نیازهای کاربران است. همانگونه که قبل از این اشاره شد، در سیستم پیشنهادی فرض بر این است که مفاهیم سطح بالا یا همان ویژگیهای معنایی نهفته در تصاویر پایگاه ، محدود بوده و همه کاربران در این مورد با یکدیگر توافق­نظر دارند. بنابراین جستجوی کاربر به این شکل آغاز خواهد شد که کاربر گروه معنایی مورد نظر خود را از میان گروههای معنایی موجود انتخاب کرده و به سیستم اعلام می­کند (پیکانهای نازک نقطه چین در شکل ۴-۲ ). این عمل می­تواند به صورت متنی یا گرافیکی انجام شود.

سیستم ویژگی معنایی تصویر دلخواه کاربر را می­داند و با توجه به اطلاعات جدول معنایی، از گروه معنایی مورد نظر تصاویری را انتخاب کرده و به کاربر ارائه می­کند (پیکانهای نازک نقطه چین در شکل         ۴-۲). در این باره که سیستم چه تصاویری را انتخاب و  به کاربر ارائه کند، راههای زیادی می­توان پیشنهاد کرد. انتخاب اتفاقی از میان تصاویر گروه مورد نظر یا انتخابی که بر اساس درجه تعلق تصاویر به گروه مورد نظر باشد یا آنکه خوشه­بندی تصاویر گروه معنایی در حوزه ویژگیهای سطح پایین و انتخاب چند تصویر از هر خوشه، می­توانند به عنوان راهکارهایی مناسب ارائه شوند.

بعد از نمایش تصاویر، کاربر باید برای هر یک از آنها، یکی از وضعیتهای پیش­بینی شده در مورد ارتباط تصویر بازیابی شده با تصویر دلخواهش را اعلام کند. فرآیند استفاده از بازخورد ارتباط با اعلام نظر کاربر شروع می­شود . از این به بعد، سیستم دو هدف را دنبال می­کند. هدف اول، ساخت یا بهبود پرس و جوی فرضی کاربر و نیز پیدا کردن تابع شباهت مناسب برای جستجوی تصاویر گروه معنایی مورد نظر است. این هدف با توجه به اعلام نظری که کاربر درباره تصاویر می­کند به عنوان هدف کوتاه مدت، پیگیری خواهد شد (پیکانهای نازک با خط پر در شکل ۴-۲  ) .

هدف دوم، تصحیح ویژگیهای معنایی مربوط به تصاویری است که کاربر راجع به آنها اعلام نظر کرده است. با توجه به اینکه کاربر مشغول به جستجوی تصویری از یک گروه خاص معنایی است، تصاویر مرتبط و غیر مرتبط به آن گروه معنایی، طی اعلام نظر کاربر درباره آنچه که به او نشان داده شده است، مشخص  می­شوند. به این ترتیب درجه تعلق این تصاویر به گروههای متفاوت تصحیح می­شود. این موضوع تحت عنوان یادگیری بلند مدت دنبال می­شود(پیکانهای نازک با خط پر در شکل ۴-۲ ).

سیستم پس از تصحیح تابع شباهت و بهبود پرس و جوی کاربر، پایگاه ویژگیهای سطح پایین را با توجه به اطلاعات جدول معنایی جستجو کرده و نزدیکترین تصاویر را به کاربر ارائه می­کند. لازم به ذکر است که تنها تصاویری جستجو می­شوند که شامل ویژگی معنایی مد نظر کاربر باشند. کاربر نظر خود را درباره ارتباط تصاویر ارائه شده با تصویر دلخواه خود به سیستم نظر می­کند. این روال تا زمان رسیدن کاربر به تصاویر دلخواه ادامه می­یابد . بدیهی است که در این سیستم، ویژگیهای معنایی مربوط به تصاویر، به مرور بهبود پیدا می­کنند و برای بازیابی­های بعدی مفید خواهد بود.

 


[box type=”tip” font=”tahoma” float=”right”]برای دریافت نسخه متنی(کامل تمامی فصل ها با جزییات کامل ) آن Word و منابع به کار رفته و مقالات موجود در سایت فارسی و انگلیسی (اصل مقالات فارسی و انگلیسی ) پایان نامه بازیابی تصویر براساس محتوا – پردازش تصویر و مراجع مبلغ ۶۰۰.۰۰۰ ریا ل – معادل شصت هزار تومان را به یکی از شماره کارت های زیر واریز نمایید و اطلاعات پرداخت را از طریق بخش تماس با من-(شماره تماس من پیامک کنید) ارسال نمایید. و یا از طریق پرداخت انلاین سایت به صورت آنی از طریق شبکه شاپرک به صورت اینترنتی واریز نمایید تا لینک دانلود ارسال شود.

 

بانک ملی به نام مهدی فعال۱۶۰۶ – ۰۶۷۱ – ۹۹۱۸ – ۶۰۳۷ : و شماره شبا IR-91 017 000 000 010 930 580 2008

بانک سپه به نام مهدی فعال: ۷۹۸۶– ۷۳۵۰- ۱۰۱۰ – ۵۸۹۲ و شماره شبا IR32 0150 0000 0090 2300 3002 01[/box]

 

 

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

* پاسخ به پرسش امنیتی ! * Time limit is exhausted. Please reload the CAPTCHA.