خلاصه
پردازش تصاویر امروزه بیشتر به موضوع پردازش تصویر دیجیتال گفته میشود که شاخهای از دانش رایانه است که با پردازش سیگنال دیجیتال که نماینده تصاویر برداشته شده با دوربین دیجیتال یا پویش شده توسط پویشگر هستند سر و کار دارد.
پردازش تصاویر دارای دو شاخه عمدهٔ بهبود تصاویر و بینایی ماشین است. بهبود تصاویر در برگيرندهٔ روشهایی چون استفاده از فیلتر محوکننده و افزایش تضاد برای بهتر کردن کیفیت دیداری تصاویر و اطمینان از نمایش درست آنها در محیط مقصد(مانند چاپگر یا نمایشگر رایانه)است، در حالی که بینایی ماشین به روشهایی میپردازد که به کمک آنها میتوان معنی و محتوای تصاویر را درک کرد تا از آنها در کارهایی چون رباتیک و محور تصاویر استفاده شود.
در معنای خاص آن پردازش تصویر عبارتست از هر نوع پردازش سیگنال که ورودی یک تصویر است مثل عکس یا صحنهای از یک فیلم. خروجی پردازشگر تصویر میتواند یک تصویر یا یک مجموعه از نشانهای ویژه یا متغیرهای مربوط به تصویر باشد. اغلب تکنیکهای پردازش تصویر شامل برخورد با تصویر به عنوان یک سیگنال دو بعدی و بکاربستن تکنیکهای استاندارد پردازش سیگنال روی آنها میشود. پردازش تصویر اغلب به پردازش دیجیتالی تصویر اشاره میکند ولی پردازش نوری و آنالوگ تصویر هم وجود دارند. این مقاله در مورد تکنیکهای کلی است که برای همه آنها به کار میرود. در هر سيستمي و با هر عملکردي براي تصميم گيري به داده هاي ورودي احتياج داريم. اين ورودي ها ميتوانند از يک سنسور صوتي, سنسور فاصله سنج , سنسور مادون قرمز , ميکروفن و با تصاوير ارسالي از يه دوربين باشد. امروزه پردازش تصوير بهترين ابزار براي استخراج ويژگي ها و تحليل موقعيت و در نهايت تصميم گيري صحيح مي باشد. در مورد انسان نيز به همين صورت است, اطلاعات از طريق چشم به مغز ارسال مي شوند و مغز با پردازش اين اطلاعات تصميم نهايي را گرفته و فرمان را صادر مي کند. هدف از پردازش تصوير پياده سازي عملکرد ذهن انسان در قبال داده ها و انجام پردازش هاي خاصي براي استخراج ويژگي مورد نياز براي رسيدن به هدف از پيش تعيين شده مي باشد.
مقدمه تاريخچه پردازش تصوير از سال 1964 تاكنون، موضوع پردازش تصویر، رشد فراوانی كرده است. علاوه بر برنامه تحقیقات فضایی، اكنون از فنون پردازش تصویر، در موارد متعددی استفاده می شود. گر چه اغلب این مسائل با هم نامرتبط هستند، اما عموما نیازمند روش هایی هستند كه قادر به ارتقای اطلاعات تصویری برای تعبیر و تحلیل انسان باشد. برای نمونه در پزشكی شیوه های رایانه ای Contrast تصویر را ارتقا می دهند یا این كه برای تعبیر آسانتر تصاویر اشعه ایكس یا سایر تصاویر پزشكی، سطوح شدت روشنایی را با رنگ، رمز می كنند. متخصصان جغرافیایی نیز از این روش ها یا روش های مشابه برای مطالعه الگوهای آلودگی هوا كه با تصویر برداری هوایی و ماهواره ای بدست آمده است، استفاده می كنند. در باستان شناسی نیز روش های پردازش تصویر برای بازیابی عكس های مات شده ای كه تنها باقی مانده آثار هنری نادر هستند، مورد استفاده قرار می گیرد. در فیزیك و زمینه های مرتبط، فنون رایانه ای بارها تصاویر آزمایش های مربوط به موضوعاتی نظیر پلاسماهای پرانرژی و تصاویر ریزبینی الكترونی را ارتقا داده اند. كاربردهای موفق دیگری از پردازش تصویر را نیز می توان در نجوم، زیست شناسی، پزشكی هسته ای، اجرای قانون، دفع و صنعت بیان كرد. در اوایل دهه 60 سفینه فضایی رنجر 7 متعلق به ناسا شروع به ارسال تصاویر تلویزیونی مبهمی از سطح ماه به زمین کرد. استخراج جزئیات تصویر برای یافتن محلی برای فرود سفینه آپولو نیازمند اعمال تصمیماتی روی تصاویر بود. این کار مهم به عهده لابراتوار (JPL) Jet Propulsionقرار داده شد. بدین ترتیب زمینه تخصصی پردازش تصاویر رقومی آغاز گردید و مثل تمام تکنولوژیهای دیگر سریعاً استفاده های متعدد پیدا کرد. عمليات اصلي در پردازش تصوير فشردهسازي تصاوير براي ذخيرهسازي تصاوير بايد حجم اطلاعات را تا جايي که ممکن است کاهش داد و اساس تمام روشهاي فشردهسازي کنار گذاردن بخشهايي از اطلاعات و دادهها است. ضريب يا نسبت فشردهسازي است که ميزان و در صد کنار گذاشتن اطلاعات را مشخص ميکند. اين روش ذخيرهسازي و انتقال اطلاعات را آسانتر ميکند و پهنايباند و فرکانس مورد نياز کاهش مييابد. امروزه روشهايي متعدد و پيشرفته براي فشردهسازي وجود دارد. فشردهسازي تصوير از اين اصل مهم تبعيت ميکند که چشم انسان حد فاصل دو عنصر تصويري نزديک به هم را يکسان ديده و تمايز آنها را نميتواند تشخيص دهد. همچنين اثر نور و تصوير براي مدت زمان معيني در چشم باقي مانده و از بين نميرود که اين ويژگي در ساخت تصاوير متحرک مورد توجه بودهاست. روش JPEG نام اين فرمت در واقع مخفف کلمات JOINT PHOTOGRAPHIC EXPERT GROUP است. از اين روش در فشردهسازي عکس و تصاوير گرافيکي ساکن استفاده ميشود JPEG اولين و سادهترين روش در فشردهسازي تصوير است به همين دليل در ابتدا سعي شد براي فشردهسازي تصاوير متحرک مورد استفاده قرار گيرد. براي اين منظور تصاوير به صورت فريم به فريم مانند عکس فشرده ميشدند وبا ابداع روش MOTION JPEG براي ارتباط دادن اين عکسها به هم تلاش شد که با مشکلاتي همراه بود. روش MPEG نام اين فرمت مخفف عبارت MOVING PICTURE EXOERT GROUP است. اين روش در ابتداي سال ۹۰ ابداع شد و در آن اطلاعات تصوير با سرعت حدود ۵/۱ مگابيت بر ثانيه انتقال پيدا ميکرد که در تهيه تصاوير ويدئويي استفاده ميشد. با اين روش امکان ذخيره حدود ۶۵۰ مگابايت اطلاعات معادل حدود ۷۰ دقيقه تصوير متحرک در يک ديسک به وجود آمد. در MPEG بيتهاي اطلاعات به صورت سريال ارسال ميشوند و به همراه آنها بيتهاي کنترل و هماهنگکننده نيز ارسال ميشوند که موقعيت و نحوه قرارگيري بيتهاي اطلاعاتي را براي انتقال و ثبت اطلاعات صدا و تصوير تعيين ميکند. روش MP3 MP3 نيز روشي براي فشرده سازي اطلاعات صوتي به ويژه موسيقي است که از طريق آن حجم زيادي از اطلاعات صوتي در فضاي نسبتاً کوچکي ذخيره ميشود. روش MPEG 4 از اين روش براي تجهيزاتي که با انتقال سريع يا کند اطلاعات سرو کار دارند استفاده ميشود. اين روش توانايي جبران خطا و ارائه تصوير با کيفيت بالا را دارد. مسئله خطا و جبران آن در مورد تلفنهاي همراه و کامپيوترهاي خانگي و لپتاپها و شبکهها از اهميت زيادي برخوردار است. در شبکههاي کامپيوتري بايد تصوير براي کاربراني که از مودمهاي سريع يا کند استفاده ميکنند به خوبي نمايش داده شود، در چنين حالتي روش MPEG 4 مناسب است. از اين روش در دوربينهاي تلويزيوني نيز استفاده ميشود. ايده اصلي اين روش تقسيم يک فريم ويدئويي به يک يا چند موضوع است که مطابق قاعده خاصي کنار هم قرار ميگيرند مانند درختي که از روي برگهاي آن بتوان به شاخه تنه يا ريشه آن دست يافت. هر برگ ميتواند شامل يک موضوع صوتي يا تصويري باشد. هر کدام از اين اجزا به صورت مجزا و جداگانه قابل کپي و يا انتقال هستند. اين تکنيک را با آموزش زبان ميتوان مقايسه کرد. همانطوريکه در آموزش زبان کلمات به صورت مجزا و جداگانه قرار داده ميشوند و ما با مرتب کردن آن جملات خاصي ميسازيم و ميتوانيم در چند جمله، کلمات مشترک را فقط يکبار بنويسيم و هنگام مرتب کردن آنها به کلمات مشترک رجوع کنيم، در اينجا هم هر يک از اين اجزا يک موضوع خاص را مشخص ميکند و ما ميتوانيم اجزا مشترک را فقط يکبار به کار ببريم و هنگام ساختن موضوع به آنها رجوع کنيم. هر يک از موضوعات هم ميتوانند با موضوعات ديگر ترکيب و مجموعه جديدي را بوجود آورند. اين مسئله باعث انعطافپذيري و کاربرد فراوان روش MPEG4 ميشود. براي مثال به صحنه بازي تنيس توجه کنيد. در يک بازي تنيس ميتوان صحنه را به دو موضوع بازيکن و زمين بازي تقسيم کرد زمين بازي همواره ثابت است بنا بر اين بعنوان يک موضوع ثابت همواره تکرار ميشود ولي بازيکن همواره در حال حرکت است و چندين موضوع مختلف خواهد بود. اين مسئله سبب کاهش پهناي باند اشغالي توسط تصاوير ديجيتالي ميشود. توجه داشته باشيد که علاوه بر سيگنالهاي مربوط به اين موضوعات سيگنالهاي هماهنگ کنندهاي هم وجود دارند که نحوه ترکيب و قرارگيري صحيح موضوعات را مشخص ميکند. تصاوير رقومي(ديجيتالي) تصاوير سنجش شده که از تعداد زيادي مربعات کوچک(پيکسل) تشکيل شدهاند. هر پيکسل داراي يک شماره رقمي(Digital Number) ميباشد که بيانگر مقدار روشنايي آن پيکسل است. به اين نوع تصاوير، تصاوير رستري هم ميگويند.تصاوير رستري داراي سطر و ستون مياشند. مقادير پيکسلها مقدار انرژي مغناطيسي که يک تصوير رقومي به هنگام تصوير برداري کسب ميکند، رقمهاي دوتايي(Digit binary) يا بيت ها(Bits) را تشکيل ميدهند که از قوه صفر تا ۲ ارزش گذاري شدهاست.هر بيت، توان يک به قوه ۲ (۱بيت=۲۱)ميباشد. حداکثر تعداد روشنايي بستگي به تعداد بيتها دارد. بنابراين ۸ بيت يعني ۲۵۶ شماره رقومي که دامنهاي از ۰ تا ۲۵۵ دارد.به همين دليل است که وقتي شما تصوير رستري از گيرنده خاصي مانند TM را وارد [[نرم افزار]]ي ميکنيد تغييرات ميزان روشنايي را بين ۰ تا ۲۵۵ نشان ميدهد. دقت تصوير دقت تصوير بستگي به شماره پيکسلها دارد.با يک تصوير ۲ بيتي، حداکثر دامنه روشنايي ۲۲ يعني ۴ ميباشد که دامنه آن از ۰ تا ۳ تغيير ميکند.در اين حالت تصوير دقت (تفکيک پذيري لازم) را ندارد.تصوير ۸ بيتي حداکثر دامنه ۲۵۶ دارد و تغييرات آن بين ۰ تا ۲۵۵ است.که دقت بالاتري دارد. روشهاي پردازش تصاوير يک هيستوگرام تصوير از يک تصوير T1 فيلتر شده از يک مغز، پردازش شده توسط نرم افزار مانگو. ۳ قلهٔ مشهود در اين نمودار ستوني متعلق به ماده سفيد، ماده خاکستري، و CSF (آب نخاع) ميباشند. دم سمت چپ متعلق به بقاياي جمجمه و چربي پس از حذف به روش پردازش (فيلترينگ)بدست آمده. روشهاي متعددي در پردازش تصوير بکار برده ميشوند. برخي از آنان در زير توضيح داده شدهاند: ترميم تصوير(Image restoration) بيشتر تصاويري که توسط ماهوارهها يا رادارها ثبت ميگردند، اختلالاتي در تصوير به وجود ميايد که به دليل خش ميباشد. دو اختلال مهم در تصاوير چند باندي، نواري شدن (Banding) و خطوط از جا افتاده ميباشد. نواري شدن(باندي شدن) اشتباهي که توسط سنسور گيرنده، در ثبت و انتقال دادهها روي ميدهد.و يا تغيير پيکسل در بين رديفها ميتواند باعث ايجاد چنين اشتباهي گردد. خطوط از جا افتاده
اشتباهي که در ثبت و انتقال دادهها روي ميدهد و در نتيجه، يک رديف پيکسل در عکس از بين ميرود.
بالا بردن دقت عکس و هيستوگرام تصوير يکي از کارهاي مهمي که در پردازش تصوير انجام ميگردد، بالا بردن دقت عکس به منظور ديد و تفسير چشمي دقيق تر ميباشد.روشهاي بسياري براي رسيدن به اين هدف وجود دارد ولي مهمترين آنها، افزايش تباين(Contrast) تصوير و عمليات فيلتر کردن ميباشد. در هر تصوير رقومي، مقادير پيکسلها بيانگر خصوصيات آن تصوير(مانند ميزان روشنايي تصوير و وضوح آن) ميباشد.هيستوگرام تصوير در حقيقت بيان گرافيکي ميزان روشنايي تصوير ميباشد. مقادير روشنايي(براي مثال ۰-۲۵۵) در طول محور X بيان شده و ميزان فراواني هر مقدار در محور Y بيان ميگردد. تصوير ۸ بيتي(۰-۲۵۵) در بالا و هيستوگرام مقادير پيکسل تصوير در پايين. محور افقي بين ۰-۲۵۵ و محور قائم، تعداد پيکسل