You are using an outdated browser. For a faster, safer browsing experience, upgrade for free today.




  • تشخیص صوت       Voice Recognition

    صدا یا صوت از انواع انرژی است که از تحرک ذرات ماده به وجود می‌آید. صدا ارتعاشی است که توسط حس شنوایی انسان درک می­شود. برای اندازه گیری شدت صوت، از واحد دسی بل استفاده می‌کنند. محدودة شنوایی انسان بین۲۰ تا ۲۰۰۰۰ هرتز است و در علوم جنایی به عنوان یک عامل بیومتریک برای شناسایی مجرمان استفاده می ­شود (1).

    استفاده از شناسایی صدا در پرونده های جنایی، دارای سابقة طولانی است. صدها سال است که از این مشخصه بیومتریک در شناسایی مجرماني که هنگام ارتکاب جرم فقط صدای آنها شنیده می شود، اما چهرة آنها دیده نمی شود، استفاده شده است. درسال­­- های اخیر در بسیاری از پرونده های جنایی صوت به عنوان مدرک در دادگاه پذیرفته شده است.

    اختراع تلفن و تجهیزات ضبط صوت، جایگاه جدیدی برای قانونی شدن بررسی اصوات باز کرد. هم زمان ابزار تجزیه و تحلیل مناسب نیز، برای تجزيه و تحليل صوت و گفتار توسعه داده شدند. نقطة عطف در مراحل بعدی توسعه، اختراع طیف نگار بود. بسیاری از این کارها، توسط بل و همکاران او در آزمایشگاه های تلفن از اواخر دهه سی و بعد، انجام شد. ساخت و ساز طیف سنج آنها، بر روی ایده های پیشنهاد شده توسط استاینبرگ (2) بنا شده بود. طیف سنجی برهمین مبنا، بعدها توسطElemetrics Kay تولید و تحت نام تجاری سونوگراف ارائه شد (3).

    انگیزة اصلی در پشت توسعة طیف سنج، مطالعه طیف آوایی بیان بود ( یک رویکرد در مطالعة تولیدگفتار و اندازه گیری استاینبرگ). یک طیف نگار واقعی، مترجم مستقیم نامیده می­شود که اسپکتروگرام (طیف نگارة) تولید شده از آن، در صفحه نمایش فلورسنت نشان داده می­شود. از طیف نگار به عنوان ابزار کمک آموزش تلفظ، برای اشخاص ناشنوا و فراگیران زبان های خارجی استفاده می­شود و یک ابزار بسیار ارزشمند برای پژوهش فونتیک ( ترکیب اصوات ) است. استفاده از طیف نگار برای شناسایی آثار صوت (Voiceprintsهمانند اثر انگشت در شناسایی افراد مؤثر است. برای اولین بار یک مهندس در آزمایشگاه بل به نام Kersta شروع به استفاده از آثار صوت در پرونده های واقعی پزشکی قانونی کرد و بعدها ريیس آزمایشگاه تحقیقات صوت شد. اقدامات او با توجه به دقت شناسایی صاحب صدا توسط آثار صوت، فوق العاده بود. براساس مقایسه قابل توجه از کلمات کلیدی، محققان در شناسایی، بیش از 99درصد نتایج صحیح به دست آوردند. در سال 1966کرستا (4) شرکت بل را ترک کرد و در شرکت خودش به نام" شرکت آزمایشگاه های آثار صوت"، به ارائه خدمات در تحقیقات جنایی صدا و آموزش به مردم در شناسایی آثار صوت پرداخت. نظریه های کارشناسی Kersta، به عنوان مدرک توسط دادگاه ها، اما نه در همة ایالت ها پذیرفته می­شد ؛ زیرا از سوی جامعه علمی با چالش جدی مواجه نشده بود ؛ تا اینکه با مطالعة انجام شده توسط جوان و کمپبل (1967) مشخص گردید اگرچه قدرت تشخیص و شناسایی مظنون در ادای دوکلمه در یک متن 78.4درصد است، لیکن قدرت شناسایی همان فرد با ادای همان دو کلمه در وسط متن دیگر به 38.3درصد کاهش می­یابد (5). تشخیص صدا به عنوان تابعی از فاصلة زمانی، بین اولین شنیدن صدا و شناختن صدا با یک فاصله زمانی، مورد آزمایش قرار گرفت. در اولین آزمایش یک نفر یک متن56 کلمه ای را خواند. سپس در فواصل 1، 2 و 3 روز، 1، 2 و 3 هفته، 1، 3 و 5 ماه شنیده شد. نرخ تشخیص به عنوان یک تابع از زمان متفاوت بود. درستی تشخیص پس از گذشت 1روز تا 1 هفته 80درصد.، بعد از 2 هفته میزان شناخت به 69 درصد، پس از یک ماه تا 57درصد، پس از 3 ماه تا 35 درصد و بعد از 5 ماه به 13درصد کاهش پیدا کرد. نتایج حاصل از این آزمایش در تشخیص صدا، به طور کلی با مطالعات دیگر با فروپاشی حافظه در طول زمان همخوانی دارد (6).

    تغییرات صداها در بیش از یک دورة یک ساله یا چند سال ممکن است در میزان دقت شناسایی فرد، تأثیر بگذارد. این موضوع در سال2001 توسط هولئین و شوارتز با یک سری آزمایش ها بررسی شد. در این آزمایش ها، آنها زمان شروع ( بین صدای ضبط شده ) از چهار هفته تا بيست سال را مورد بررسی قرار دادند. قدرت تشخیص، برای نمونة معاصر حدود 95درصد بود که با گذشت چهار هفته تا شش سال به 70-85 درصد کاهش یافت و یک افت شدید تشخیص، حدود 35 درصد برای بيست سال مشاهده شد. علاوه بر عامل زمان، دو عامل دیگر اثر گذار در تشخیص صوت نیز، مورد آزمایش قرار گرفتند:1- تجربة شنونده؛ 2- شباهت بین صداها. همان طوری که انتظار می­رفت، دقت تشخیص کارشناسان با تجربة صوت برای شناسایی صحیح هویت از روی صدا برای فاصله زمانی بيست ساله 76درصد و قدرت تشخیص شباهت صدا برای دو نمونه معاصر 95درصد بود؛ که با فاصلة زمانی چهار هفته به 40درصد کاهش یافت. بنابراین با توجه به آزمایش های یاد شده، بررسی صوت در پرونده های جنایی، باید توسط کارشناسان مجرب صوت، انجام شود (7). نرخ شناسایی صحیح برای هشت دقیقه محرک، در مقایسه با سي ثانیه محرک، به طور قابل ملاحظه ای بالا است. به عبارت دیگر اهمیت تنوع تلفظ در تشخیص صوت، از مدت زمان صدا بیشتر است (8).

    در یک مطالعه توسطYarmey (1991) تشخیص صدای ضبط شده بر روی تلفن، مورد مطالعه قرار گرفت. در این مطالعه، تعداد شناسایی صحیح، با افزایش مدت زمان نمونه صوت از 3.2 و 4.3 دقیقه به 7.8 دقیقه افزایش یافت. اما همین طور هم تعداد هشدارهای کاذب نیز اضافه شد. در این مطالعه مشخص شد که بیشتر مشکلات کیفی رایج در پرونده های جنایی فونتیک، سر و صدای پس زمینه و پهنای باند ضبط و انتقال است. شامل چیزهای مختلف به عنوان سر و صدا به صورت تصادفی مانند کسی که صحبت می کند یا رادیویی که در حال پخش در پس زمینه است. بخش بزرگی از تهدیدات، از طریق تلفن انجام می­شود و اغلب جنایتکاران از تلفن را برای برنامه ریزی انجام جنایت استفاده می­کنند. به همین دلیل است که توجه به مطالعات فونتیک، در پزشکی قانونی اهمیت پیدا کرده است. اگرچه بسیاری از فرکانس های مربوط به انتقال بیان، توسط تلفن پوشش داده می­شوند، لیکن با توجه به محدود بودن پهنای باند خطوط تلفن، به عنوان مثال فرکانس های زیر300 هرتز فیلتر می­شوند. با گوشی های تلفن همراه، مشکلات مربوط به رمز گذاری گفتار، نشان داده می­شوند، که این اثر، برای صدای زن به خصوص، قابل توجه است. سؤالات مهم در زمینه پرونده های پزشکی قانونی، کیفیت ضعیف تر صدای مکالمات تلفنی ضبط شده و آثارسوء آن در شناسایی صدا است و اگر چنین است تا چه حد و چگونه. از نظر روش شناختی تنها باید صداهای ضبط شده با تلفن به عنوان نمونه های جنایی با صداهای متهم ضبط شده با تلفن مقایسه شود (9).

    ·          تغییر صدا

    تغییر صدا، باتوجه به وسعتی که از آن استفاده شود، ممکن است یک مشکل جدی برای شناسایی صاحب صدا باشد. دست کاری الکترونیکی یا حتی برقراری ارتباط از طریق سنتز گفتار، می تواند شناسایی سخنران را عملاً غیر ممکن سازد. در پرونده های جنایی واقعی، تغییر صدا و سطح پنهان بیان، تقلید گویش، لهجة خارجی و غیره، شناسایی مجرمان را با مشکل مواجه می­کند (10).

     

    ·            لهجة خارجی و زبان های خارجی

    لهجة خارجی و زبان های خارجی در شناسایی صاحب صدا معمولاً - نه همیشه- اثر گذار بوده و شناسایی را مشکل­تر می­سازد. در مطالعه انجام شده توسط مک گیهی (11) در سال 1937، تأثیر لهجة خارجی شامل شناسایی یک سخنران زبان انگلیسی با لهجة آلمانی، آزمايش شده است. در یک مطالعه توسط داتی در سال 1998، خواندن جملات انگلیسی افرادی با زبان انگلیسی مادری از ایالات متحده و انگلستان و افرادی با زبان انگلیسی به عنوان زبان خارجی از فرانسه و بلیز ثبت شد. میزان شناسایی افراد با زبان انگلیسی مادری به طور چشم گیری بیشتر از اشخاص با لهجة خارجی بود (12). نتایج حاصل از یک مطالعه توسط گلدشتاین (13) و همکاران نشان داد " تشخیص صداهای با لهجه در صورت طولانی بودن نمونه صوت، مشکل تر از صداهای بدون لهجه نيست و کاهش طول مدت نمونه گفتار، موجب کاهش حافظه برای شناسایی صداهای با لهجه و بدون لهجه می­شود، لیکن این کاهش برای صداهای با لهجه بیشتر است. همان طور که دیده می­شود، نتایج به دست آمده تا حدودی مبهم است، اما شاید نتیجه گیری شود که تمایل برای شناسایی صدای با لهجه کمتر است، اگر چه تفاوت اغلب اندک است. این نیز بسیار محتمل است که قدرت تشخیص متخصصان با تجربه، مانند زبان شناسان، در شناسایی صدای با لهجه، بالاتر از افراد غیرحرفه ای است.

    نفوذ زبان های خارجی نیز موضوع بسیاری از مطالعات بوده است. در مطالعه انجام شده توسط تامپسون، شش دانش آموز پسر دو زبانه پیام هایی به زبان انگلیسی، اسپانیایی و انگلیسی با لهجه قوی اسپانیایی ارسال کردند. بهترین شناسایی صداها توسط (شنونده تک زبانه انگلیسی) درهنگام صحبت کردن به زبان انگلیسی و بدترین شناسایی برای صحبت به زبان اسپانیایی بود و صحت شناسایی برای صدای با لهجه در حد متوسط ​​بود. شیلر و کوستر در مطالعه ای در سال1996، آمریکایی هایی که آلمانی نمی دانستند و آمریکایی ­هایی که کمی آلمانی می­دانستند و آلمانی هایی با زبان مادری را مورد آزمایش قرار دادند. خطاهای شناسایی، برای افرادی که آلمانی نمی­ دانستند نسبت به بقیه قابل ملاحظه تر بود. خلاصة مطالعات نشان می­ دهد که قدرت شناسایی صداها با یک زبان، توسط افرادی با همان زبان، بهتر از افرادی است که زبان مورد بررسی، زبان مادری آنها نيست.

    ·      شهود صدا (14)

    عواملی مربوط به شناخت، مانند حافظه، آشنایی اولیه با مجرم، تغییر و تحریف صدا و برخی عوامل دیگر که در بالا توضیح داده شد در قدرت تشخیص شهود نیز مؤثر است. بنابراین محیط آزمایشگاه ممکن است شباهت کمی به زندگی واقعی شاهد داشته باشد.


    از جمله تفاوت ها در مرحلة اول، تنش و اضطراب است که آزمایشگاه نمی­تواند تنش مشابه وارد شده به شاهدان در شرایط زندگی واقعی را ایجاد کند تا شاهدان صدایی را که در صحنة جرم شنیده اند با صدای مظنون مقایسه و تشخیص دهند. ثانیاً ایجاد شرایط آزمایشگاهی کاملاً مشابه صحنة جرم برای شهود در تشخیص صدا اثر گذار است (15).

    کلید واژه ها

    تشخیص صوت، آثار صدا، لهجة خارجی، شهود صدا.

    ارجاعات

    1-       Kopp, G. A. and H. C. Green (1946). "Basic phonetic principles of visible speech." Journal of the Acoustical Society of America 18: 74–89.

    2-           Steinberg.

    3-            Grey, G. and G. A. Kopp (1944). "Voiceprint identification." Bell Telephone Laboratories Report: 1–14.

    4-             Kersta.

    5-             Koenig, B. E. (1986). "Spectrographic voice identification: A forensic survey." Journal of the Acoustical Society of America 79: 2088-2090.

    6-       Meuwly, D. (2003a). "Le mythe de « L’empreinte vocale » (I)." Revue internationale de criminologie et de police technique et scientifique 56(2): 219–236.

    7-          Hollien, H. and R. Schwartz (2001). "Speaker identification utilizing noncontemporary speech." Journal of  Forensic Sciences 46: 63–67.

    8-        Künzel, H. J. (2001). "Beware of the 'telephone effect': The influence of telephone transmission on the measurement of formant frequencies." Forensic Linguistics 8: 80–99.

    9-      Schmidt-Nielsen, A. and K. R. Stern (1985). "Identification of known voices as a function of familiarity and narrowband coding." Journal of the Acoustical Society of America 77: 658–663.

    10-       Künzel, H. (2000). "Effects of voice disguise on speaking fundamental frequency." Forensic Linguistics 7: 149–179.

    11-          McGehee.

    12-         Doty, N. D. (1998). "The influence of nationality on the accuracy of face and voice recognition." American Journal of Psychology 111: 191–214.

    13-       Goldstein.

    14-        Earwitness.

    15-           Yarmey, A. D. (2001). "Earwitness descriptions and speaker identification." Forensic Linguistics 8: 113–122.

     

     

نظر شما