گوش بهعنوان یک ویژگی بیومتریک
مقدمه
پتانسیل گوش انسان برای شناسایی فردی از سال 1890 توسط جرمشناس فرانسوی، آلفونس برتیون، شناسایی و حمایت شد. او در کار پیشگامانه خود در زمینه بیومتریک نوشت:
«گوش، به لطف درهها و تپههای کوچک متعددی که سطح آن را پوشاندهاند، مهمترین عامل از دیدگاه شناسایی است. این عضو از بدو تولد شکل ثابتی دارد، در برابر تأثیرات محیط و آموزش مقاوم است و در طول زندگی مانند میراثی تغییرناپذیر از وراثت و زندگی داخل رحمی باقی میماند.»
بیومتریک گوش در مقایسه با روشهای محبوبتر مانند تشخیص چهره، چشم یا اثر انگشت، توجه کمتری دریافت کرده است. با این حال، گوشها سالهاست که در علوم جرمشناسی، بهویژه در ایالات متحده، نقش مهمی ایفا میکنند. در آنجا، سیستمی برای طبقهبندی گوشها بر اساس اندازهگیریهای دستی توسط ایانارلی توسعه یافت و بیش از 40 سال مورد استفاده قرار گرفته است، اگرچه اخیراً اعتبار شواهد اثر گوش مورد质疑 قرار گرفته است. راتی و همکاران چگونگی خودکارسازی تکنیکهای دستی ایانارلی را بررسی کردند و یک ابتکار اروپایی ارزش اثر گوش را در جرمشناسی مورد مطالعه قرار داد.
گوشها نسبت به سایر ویژگیهای بیومتریک مزایایی دارند؛ همانطور که برتیون اشاره کرد، ساختار غنی و پایداری دارند که با افزایش سن تغییر کمی میکند. گوش تحت تأثیر تغییرات حالت چهره قرار نمیگیرد و بهطور ثابت در وسط کناره سر قرار دارد، بنابراین پسزمینه اطراف آن قابل پیشبینی است، برخلاف تشخیص چهره که معمولاً نیاز به پسزمینه کنترلشده دارد. جمعآوری دادههای گوش مسئله بهداشتی مرتبط با بیومتریکهای تماسی ندارد و بعید است مانند اندازهگیری عنبیه یا شبکیه باعث اضطراب شود. گوش در مقایسه با عنبیه، شبکیه و اثر انگشت بزرگتر است و بنابراین از فاصله راحتتر قابل ثبت است.
شواهد و پشتیبانی از گوش بهعنوان یک ویژگی بیومتریک
ساختار گوش آنطور که برتیون پیشنهاد میکند کاملاً تصادفی نیست؛ مانند چهره دارای ساختار مشخصی است. اکثر افراد میتوانند بهراحتی شکل کلی گوش را ترسیم کنند، اما تنها یک هنرمند با تجربه میتواند جزئیات پیچیده آن را از حافظه بازسازی کند. شکل گوش عمدتاً تحت تسلط لبه خارجی (هلیکس) و شکل لوب گوش است. همچنین یک هلیکس داخلی یا آنتیهلیکس وجود دارد که تقریباً موازی با هلیکس خارجی است و در قسمت بالایی به دو شاخه تقسیم میشود. هلیکس داخلی و شاخه پایینی آن، قسمت بالایی و سمت چپ کونکا (بخش صدفیشکل گوش) را تشکیل میدهند. پایین کونکا به شکاف بینتراگوس، که به دلیل خمیدگی تند در پایین میتواند نقطه مرجع مفیدی برای بیومتریک باشد، متصل میشود. همچنین، نقطه تقاطع هلیکس با شاخه پایینی آنتیهلیکس (کروس هلیکس) و آنتیتراگوس (برآمدگی کوچک در سمت چپ شکاف بینتراگوس) بهعنوان نقاط مرجع در سیستم اندازهگیری ایانارلی استفاده میشوند.
گوش خارجی، که به آن پینا یا آورکولا گفته میشود، تنها بخشی از کل ارگان گوش است که برای مکانیابی، جمعآوری و پردازش امواج صوتی تکامل یافته است. بسیاری از پستانداران مانند اسبها، سگها و گربهها میتوانند گوشهای خود را برای مکانیابی بهتر منابع صوتی حرکت دهند. خوشبختانه برای اهداف بیومتریک، گوش انسان به دلیل بافت غضروفی محکمی که به استخوان کناره سر متصل است، تقریباً ثابت است. گوش به لطف این بافت سخت، شکل نیمهسفت خود را حفظ میکند.
گوش فاقد تقارن است، برخلاف چهره که حول محور مرکزی خود متقارن است و بنابراین از منظر بیومتریک تنها نیمی از اطلاعات چهره را ارائه میدهد. گوش از این نظر مزیت دارد، زیرا تحت تأثیر حالات چهره، آرایش، عینک یا ریش قرار نمیگیرد و تنها ممکن است با مو، گوشواره یا سمعک مخفی شود. بنابراین، گوش نسبت به بسیاری از ویژگیهای بیومتریک دیگر، بهویژه در برابر افزایش سن، مقاومت بیشتری دارد.
رویکردهای بیومتریک گوش
کار اولیه ایانارلی و گوش در جرمشناسی
آلفرد ایانارلی سیستمی برای طبقهبندی گوش توسعه داد که توسط سازمانهای اجرای قانون آمریکا استفاده شد. او در اواخر سال 1949 به گوش بهعنوان ابزاری برای شناسایی فردی در جرمشناسی علاقهمند شد و سیستم شناسایی گوش ایانارلی را ایجاد کرد. این سیستم شامل گرفتن اندازهگیریهایی در اطراف گوش با استفاده از یک قطبنمای شفاف با 8 پره در فواصل 45 درجه روی یک عکس بزرگشده از گوش است. ثبت اولیه با اطمینان از تماس خط مرجع با کروس هلیکس در بالا و عمیقترین نقطه تراگوس در پایین انجام میشود. نرمالسازی و مرحله دوم ثبت با تنظیم مکانیزم بزرگنمایی تا زمانی که خط مرجع دوم دقیقاً کونکا را از بالا به پایین پوشش دهد، انجام میشود.
ایانارلی در مقدمه کتاب خود اظهار داشت:
«طی 38 سال تحقیق و کاربرد در گوششناسی، نویسنده دریافت که در بررسی هزاران گوش از طریق روشهای بصری، عکسها، اثر گوش و برداشتهای اثر گوش پنهان، هیچ دو گوشی یکسان نبودند – حتی گوشهای یک فرد. این منحصربهفرد بودن در مورد دوقلوهای همسان، غیرهمسان، سهقلوها و چهارقلوها نیز صادق بود.»
وقتی ایانارلی میگوید که حتی گوشهای یک فرد یکسان نیستند، بهطور ناخواسته به مشکل اصلی بیومتریک اشاره کرده است. برخلاف آنچه او پیشنهاد میکند، این یک مزیت نیست که نمونههای گوش یک فرد یکسان نباشند. در واقع، هرچه این نمونهها کمتر یکسان باشند، کمتر میتوان ادعا کرد که بیومتریک یک فرد منحصربهفرد است.
اثبات مفهوم بورژ و برگر
بورژ و برگر اولین کسانی بودند که گوش انسان را در زمینه بینایی ماشین بهعنوان یک ویژگی بیومتریک بررسی کردند. با الهام از کار ایانارلی، آنها مطالعهای برای اثبات مفهوم انجام دادند که در آن امکان استفاده از گوش بهعنوان بیومتریک را هم از نظر نظری (منحصربهفرد بودن و قابلیت اندازهگیری در طول زمان) و هم در عمل از طریق پیادهسازی یک سیستم مبتنی بر بینایی کامپیوتری نشان دادند. گوش هر فرد بهعنوان یک گراف مجاورت مدلسازی شد که از دیاگرام ورونوی منحنیهای استخراجشده از نقشه لبه کنی ساخته شده بود. آنها الگوریتم تطبیق گراف جدیدی برای احراز هویت طراحی کردند که خطاهای ناشی از تغییرات نور، سایه و انسداد را در نظر میگرفت. آنها دریافتند که ویژگیها مقاوم هستند و میتوانند از فاصله بهطور قابلاعتماد استخراج شوند.
تحلیل مؤلفههای اصلی (PCA)
تحلیل مؤلفههای اصلی یکی از محبوبترین رویکردها برای شناسایی گوش بوده است. این روش ظریف، آسان برای پیادهسازی و استفاده است. تصاویر میتوانند بهعنوان بردارهایی در نظر گرفته شوند و هر تصویر میتواند بهعنوان مجموعی از بردارهای تصویری پایهای ساخته شود. PCA این بردارها را پردازش میکند تا فشردهسازی تصویر را انجام دهد و این فشردهسازی برای اهداف بیومتریک استفاده میشود.
در یک مثال واقعی با استفاده از زیرمجموعهای از پایگاه داده پروفایلهای چهره XM2VTS، شامل 4 تصویر گوش برای هر یک از 63 فرد (252 تصویر در مجموع)، PCA با تولید یک ماتریس پروجکشن خاص عمل میکند که امکان محاسبه مجموعهای از 63 وزن برای هر تصویر را فراهم میکند. این وزنها برای مقیاسبندی مجموعهای از بردارهای تصویری خاص استفاده میشوند تا تصویری شبیه به تصویر اصلی تولید کنند. به جای نیاز به 8103 وزن، تنها 63 وزن کافی است که فشردهسازی بالایی (بیش از 100:1) را فراهم میکند، هرچند این فشردهسازی با افت همراه است. این وزنها بردارهای ویژگی 63 عنصری را تشکیل میدهند که برای مقایسه بیومتریک مناسب هستند و امکان محاسبه فاصله اقلیدسی بین تصاویر را فراهم میکنند. در این آزمایش، نرخ شناسایی 98.4% (186 از 189) به دست آمد.
تبدیل میدان نیرو
هورلی و همکاران یک تبدیل خطی قابلبرعکس توسعه دادند که تصویر گوش را به یک میدان نیرو تبدیل میکند، با این فرض که پیکسلها جذبی متقابل متناسب با شدت خود و معکوس با مربع فاصله بین آنها دارند، مشابه قانون جهانی گرانش نیوتن. این میدان نیرو دارای یک میدان انرژی مرتبط است که در مورد گوش به شکل سطحی صاف با چندین قله و پشته ظاهر میشود. این قلهها به چاههای انرژی بالقوه و پشتهها به کانالهای انرژی بالقوه مربوط میشوند. از آنجا که این تبدیل قابلبرعکس است، تمام اطلاعات اصلی حفظ میشود و ویژگیهای قلهها و پشتهها اطلاعات زیادی را منتقل میکنند که برای شناسایی مناسب هستند. این روش نرخ شناسایی بیش از 99% را در پایگاه دادهای با 252 تصویر گوش از 63 فرد به دست آورد.
بیومتریک گوش سهبعدی
آورکولا دارای ساختار سهبعدی غنی و عمیقی است، بنابراین جای تعجب نیست که چندین گروه تحقیقاتی بر این جهت تمرکز کردهاند.
رویکرد یان و بویر: یان و همکاران از اسکنر رنج Minolta VIVID 910 برای ثبت اطلاعات عمق و رنگ استفاده کردند. آنها سیستم بیومتریک گوش کاملاً خودکاری را با استفاده از تطبیق شکل سهبعدی مبتنی بر ICP توسعه دادند و نرخ شناسایی نزدیک به 98% را در پایگاه دادهای با 1386 تصویر از 415 فرد به دست آوردند.
رویکرد چن و بهانو: چن و همکاران نیز از اسکنر رنج Minolta برای سیستم شناسایی سهبعدی استفاده کردند. گوشها با استفاده از تطبیق الگو از خوشههای لبه در برابر مدل گوش مبتنی بر هلیکس و آنتیهلیکس شناسایی شدند و نقاط ویژگی بر اساس شکل سطح محلی استخراج شدند. امضایی به نام “پچ سطح محلی” (LSP) برای هر نقطه ویژگی محاسبه شد و با ترکیب با ICP، نرخ شناسایی 90.4% به دست آمد.
شناسایی صوتی گوش
آکرمانس و همکاران از خواص صوتی گوش برای شناسایی استفاده کردند. گوش به دلیل شکل خاص خود مانند یک فیلتر عمل میکند، بهطوری که سیگنال صوتی پخششده به گوش بهصورت تغییر یافته بازمیگردد. این تابع انتقال صوتی اساس امضای صوتی گوش را تشکیل میدهد. این روش میتواند در گوشیهای موبایل با استفاده از میکروفون کوچک در هدفون پیادهسازی شود.
نتیجهگیری و چشمانداز
گوش بهعنوان یک ویژگی بیومتریک دیگر در مراحل ابتدایی نیست و پیشرفتهای امیدوارکنندهای نشان داده است، بهویژه با توجه به تحقیقات اخیر در زمینه پتانسیل سهبعدی آن. این ویژگی از حمایت جرمشناسی برخوردار است، ساختار آن فردی به نظر میرسد و نسبت به سایر ویژگیهای بیومتریک با افزایش سن تغییرات کمتری دارد. گوش بهطور منحصربهفرد از شناسایی بصری و صوتی بهطور همزمان پشتیبانی میکند و ساختار سهبعدی عمیق آن جعل را دشوار میکند.
سؤال مهم “گوش بهعنوان یک ویژگی بیومتریک چقدر خوب است؟” تنها بهتازگی شروع به پاسخ داده شدن کرده است. نتایج اولیه با مجموعه دادههای کوچک ناامیدکننده بودند، اما اکنون گزارشهای منظمی از نرخهای شناسایی در محدوده بالای 90 درصد با مجموعه دادههای بزرگتر وجود دارد. با این حال، نیاز به آزمایشهای درونکلاسی بهتر، هم از نظر تعداد نمونهها برای هر فرد و هم از نظر تنوع در طول زمان، وجود دارد.
تحقیقات آینده ممکن است بر بررسی این موضوع تمرکز کند که آیا بخشهای خاصی از گوش برای شناسایی مهمتر هستند یا خیر، و توسعه تکنیکهایی با invariance بهتر و سرعت بالاتر برای مدیریت مجموعه دادههای بزرگ ضروری است. مشکل انسداد گوش توسط مو همیشه یک چالش خواهد بود، اما این مشکل ممکن است با توسعه طرحهای تصویربرداری حرارتی کاهش یابد.