Preaload Image
اعضای آزمایشگاه – اعضای فعلی – دانشجویان کارشناسی ارشد

عرفان اشتری

زمینه تحقیقاتی : —
بازه فعالیت در آزمایشگاه : از 1397
erfan.ashtari@ut.ac.ir

1

2

Citations: 0
h-index: 0
i10-index: 0
No. of Papers: 0

تحصیلات

کارشناسی : برق قدرت – دانشگاه شاهد
کارشناسی ارشد : برق و کامپیوتر – دانشگاه تهران
دکتری : —

عرفان اشتری تحصیلات مقطع کارشناسی خود را در رشته مهندسی برق قدرت دانشگاه شاهد تهران از سال 1392 (2013) تا 1396 (2017) طی نمود و پس از آن برای مقطع کارشناسی ارشد از طریق شرکت در آزمون سراسری سال 1397 (2018) وارد دانشگاه تهران و رشته ی مهندسی برق کنترل این دانشگاه شد. وی در طول دوره کارشناسی خود علاقه مند به برنامه نویسی بود و فعالیت هایی در زمینه برنامه نویسی به زبان c++ انجام داد. در دوره کارشناسی ارشد به دلیل علاقه به مباحث هوش مصنوعی و رباتیک وارد آزمایشگاه تعامل انسان و ربات شد و تحصیل و پژوهش خود را زیر نظر جناب آقای دکتر مهدی طالع ماسوله و جناب آقای دکتر احمد کلهر پی گرفت. در دوره کارشناسی ارشد عمده فعالیت وی مربوط به هوش مصنوعی و استفاده از یادگیری عمیق با بهره گیری از زبان برنامه نویس پایتون و به منظور شناسایی افراد از طریق شناسایی چهره و همچنین شناسایی صوت بوده است. در این زمینه ابتدا به کار تشخیص چهره با الگوریتم های متداولی مانند dlib و MTCNN و سپس شناسایی چهره با استفاده از شبکه های عصبی عمیق Resnet50 و VGG16 و همینطور شبکه siamese به همراه تابع خطای Triplet Loss به منظور شناسایی چهره به صورت oneshot پرداخت که این موارد در ربات sanbot آزمایشگاه و همینطور شرکت توسن تکنو مورد استفاده قرارگرفت و مقاله ای در زمینه یاد شده در کنفرانس ملی برق سال 2020 تبریز به ثبت رسید. در ادامه وی به فعالیت در مورد پایان نامه خود با عنوان (شناسایی افراد با استفااده از صوت و با بهره گیری از شبکه های عصبی عمیق و مبتنی بر روش های هندسی ) مشغول است که در این زمینه تا کنون به پیاده سازی روش نوینی برای آموزش شبکه های عصبی عمیق با استفاده از مبانی هندسی که ایده آن از جناب آقای دکتر کلهر میباشد مشغول بوده و امید است این روش به کاهش زمان آموزش و همینطور Generalization بهتر و به طبع آن دقت بالاتر منجر شود. در ادامه و پس از پیاده سازی روش مذکور با استفاده از ماژول pycharm در پایتون ، به منظور تکمیل پروژه دوره کارشناسی ارشد خود به به کارگیری این روش درمورد کاربردهای شناسایی چهره و صوت مشغول خواهد شد.

تشخیص هویت مبتنی بر صدای انسان با استفاده از شبکه های عصبی عمیق و براساس شاخص های هندسی

نیاز شناسایی هویت افراد، در دنیای امروز بیش از پیش به چشم می آید. به طوری که شناسایی افراد در تمامی جوانب زندگی مورد استفاده قرار می گیرد. کاربردهای روزمره آن از کارتهای اعتباری گرفته تا جرمشناسی و رمزهای حساب به صورت تلفنی گسترش یافته است. مدتهاست که استفاده از شناسه های کاربردی مختلف برای تعیین هویت شخص مورد استفاده قرار میگیرد، از مرسوم ترین این شناسه ها میتوان به شماره شناسنامه، کدملی، نام، نام خانوادگی و … اشاره کرد. در حالت کلی، فرد می تواند توسط چیزی که مالك آن است و یا اطلاعات مخصوص به خود، شناسایی شود. این ابزارها که ابزار تعیین هویت سنتی می باشند در طول چندین قرن اخیر مورد استفاده قرار گرفته اند، دارای نواقص بسیاری می باشند. ممکن است گم، دزدیده یا فراموش شوند و یا مورد سوءاستفاده قرار گیرند. این مسئله خود، امنیت این شناسه ها را کمتر می نماید و پژوهشگران را به یافتن شناسه های قابل اطمینان مانند شناسه های زیست سنجی متمایل نموده است .
روش های جدیدتر شناسایی هویت مبتنی بر استفاده از خصوصیات فیزیولوژیکی و رفتاری منحصربفرد در شخص میباشند. این روشها به شناسایی هویت مبتنی بر زیست سنجی (بیومتریك) معروف هستند. این روش ها امروزه به عنوان جایگزینی مناسب برای شناسه های معمول در کانون توجهات قرار گرفته اند. این روش ها بعضی از مشکلات ذکرشده در روشهای سنتی را تا حدود زیادی مرتفع نموده اند. سیگنالها و معیارهای مختلفی برای سیستمهای شناسایی افراد از روی مشخصه های حیاتی آنها تا به حال مورد مطالعه قرار گرفته اند. از این میان معروفترین مشخصه های زیست سنجی، اثرانگشت، چهره، عنبیه چشم و صدای افراد میباشند. این شناسه های زیست سنجی کمتر قابل جعل بوده و قابلیت اطمینان این سیستمها قابل توجه میباشد.
روش های متعددی برای شناسایی گوینده مورد بررسی قرارگرفته این روش ها شامل دو گروه كلی میشوند:
1- وابسته به متن
2- مستقل از متن
برای این روش ها از مدل ها و شیوه های مختلفی برای دسته بندی گوینده ها استفاده میشود از جمله GMM (مدل مخلوط گوسی) ،HMM (مدل مخفی ماركوف) ، SVM (ماشین بردارپشتیبان) و DNN (شبکه عصبی عمیق) كه از معروفترین آنها هستند. در این پژوهش قصد براین است كه با استفاده از شبکه های عصبی عمیق و با طراحی شبکه ای كه مبنای یادگیری در لایه های مختلف آن براساس شاخص جداسازی (Separation Index) می باشد، شبکه و روش جدیدی را برای انجام شناسایی گوینده مستقل از متن و وابسته به متن را به كارگیریم .
برای انجام این كار ابتدا به طراحی و پیاده سازی شبکه مورد بحث پرداخته می شود، كه این شبکه باید به گونه ای باشد كه با حركت رو به جلو در لایه ها، میزان شاخص جداسازی افزایش یابد و كلاس های مختلف به شکل مناسب تری از یکدیگر جداشوند. پس از آزمایش این شبکه برروی داده های مختلفی مانند داده های معروف تصویری، به سراغ شناسایی گوینده رفته و پس از استخراج ویژگیهای مناسب از جمله MFCC (ضرایب كپسترال فركانس مل) از صوت افراد، كار دسته بندی افراد برمبنای صدای آنها توسط شبکه مذكور انجام میگیرد.
منبع پایان نامه

کلمات کلیدی:

یادگیری عمیق
نشخیص صدا
تشخیص هویت
پردازش تصویر
تشخیص چهره
شبکه های عصبی کانولوشن
ربات اجتماعی Sanbot
ندارد.