هوش مصنوعی و پردازش صوت
چشم انداز هوش مصنوعی و صنعت صوتی
ظهور میکروفون های سیلیکونی، چشمانداز صنعت صوتی را تغییر داده است. اما شرکت تحقیقات بازاری ای به اسم “Yole Dévelopment” معتقد است که در سال های آینده، هوش مصنوعی منجر به تحول و دگرگونی بازار خواهد شد.
دستیاران شخصی مبتنی بر صدا (VPAs) در گوشیهای هوشمند، بلندگوهای هوشمند، ساعتهای هوشمند، هندزفری ها، خودروها، تلویزیون های هوشمند و کنترل های از راه دور در حال افزایش هستند. حتی سطل زبالههایی هم وجود دارند که با سنسور تشخیص صدا کار میکنند.
برای مرکز Yole Dévelopment (لیون، فرانسه)، صنعت صوتی بخش بعدی ای است که توسط هوش مصنوعی مورد آزمایش قرار میگیرد.
هوش مصنوعی و پردازش صدا
تکنولوژی vpa ، امروزه محرک اصلی صنعت صوتی هستند. این VPA ها براساس اجزای سنتی سیستم های صوتی مانند کدک های صوتی، میکروفون ها، میکرو بلندگو و تقویتکننده های صوتی ساخته شده اند، و همچنین از هوش مصنوعی برای محاسبه و تحلیل دادههای صوتی استفاده میکنند. و محاسبات، توابع صوتی پیچیده مانند تشخیص گفتار و تعیین مکان منبع را ممکن می سازد. بخش تحلیل، که نیازمند قدرت پردازش بالا و دسترسی به دادههای زیادی است، در محیط ابری اجرا میشود.
Dimitrios Damianaos، تحلیلگر بازار فنآوری در بخش فوتونیک و سنجش در Yole میگوید: “ارزش افزوده هوش مصنوعی در زمینه پردازش زبان طبیعی است. صدا یک روش طبیعی برای تعامل با ماشین است. لازم نیست از صفحهکلید استفاده کنید. مجبور نیستید از دستتان استفاده کنید. شما فقط از صدای خود استفاده میکنید.” با این حال، پردازش زیادی باید انجام شود تا درک شود که کاربران در مورد چه چیزی صحبت میکنند، زبان آنها چیست و منظور آنها چیست. “هوش مصنوعی ارزش رمزگشایی و کمک به ارتباط با دستگاهها را میافزاید.”
ارزش صوت برای شرکت های بزرگ تکنولوژی
آنچه که ما باور داریم و میبینیم این است که شرکت های بزرگ تکنولوژی مانند گوگل، اپل، فیس بوک، آمازون و مایکروسافت (که در مجموع با نام GAFAM شناخته میشوند) سعی میکنند این VPA ها را به جلو برانند، زیرا در دادههایی که استخراج میکنند ارزش واقعی وجود دارد.”
برای کاربران، صدا محبوب تر از تصویر است. Alexis Debray، تحلیلگر بازار تکنولوژی در MEMS و بخش سنسورها در دانشگاه Yole، ادامه داد: “کاربران صوت را کمتر مزاحم میدانند، بنابراین این راه خوبی برای گروه GAFAM است که کسب و کار اصلی آنها، اطلاعات است، تا از مردم اطلاعات جمعآوری کنند.”
“برخی از شرکتها کسبوکار خود را با داده انجام میدهند در حالی که برخی دیگر کسبوکار خود را با حریم خصوصی و تکنولوژی تنظیم میکنند که حریم خصوصی را برای کاربر تضمین میکنند.” برای مثال، اپل حریم خصوصی را ترجیح می دهد و آن را به یک دارایی بازاریابی قدرتمند تبدیل میکند.
آگاهی کامل
Damanos گفت: ارزش واقعی برای شرکتهای فنآوری بزرگ استخراج هر چه بیشتر اطلاعات از محیط است، به این معنی که VPA ها نه تنها به صدای کاربران گوش میدهند بلکه به محیط اطراف خود نیز گوش میدهند و محیط آنها را درک میکنند. به طور مثال، “اگر شما در آشپزخانه خود هستید، میکروفون میتواند صدای چاقو را بر روی پیشخوان بشنود و فورا درک کند که شما در آشپزخانه هستید و یک دستور العمل را پیشنهاد میدهد”
گام بعدی هوش مصنوعی محاورهای، میتواند آگاهی کامل باشد، به طوری که دستیار مجازی، چه یک بلندگوی هوشمند باشد و چه یک ساعت مچی هوشمند، همانند یک انسان با کاربر ارتباط برقرار میکند. Damianos گفت که آگاهی کامل مفهومی است و علامت سوال دارد. او گفت: “ما هنوز زمان آن را نمیدانیم، اما شاید در عرض ۵ تا ۶ سال بعد از هوش مصنوعی فرا برسد. این امر به پیشرفت هوش مصنوعی و شرکت های [در حال توسعه] در این حوزه بستگی خواهد داشت.”
حریم خصوصی
حریم خصوصی شامل ابعاد متعددی است، چرا که کاربر ممکن است بخواهد جنسیت، سن یا احساسات خود را پنهان کند. Debray با نگاهی به آینده گفت که او مطمئن است که مهندسان در میکروفن، در ASIC یا بخش های پردازشگر نرمافزار فناوری هایی را توسعه خواهند داد که حریم خصوصی کاربر را تضمین میکنند. به طوری که میکروفنها احساسات را از صدا حذف میکنند و دادههای صوتی را به تنهایی ارایه میدهند.
در مصاحبه اخیر، Matt Crowley، مدیر عامل شرکت Vesper Technologies، گفت که این شرکت به دنبال افزایش هوش میکروفون های MEMS پیزوالکتریک خود است. ما معتقدیم که در آینده، حسگرهایی خواهیم داشت که با هوش مصنوعی نهفته در سنسور ها جفت شدهاند. آنها قادر خواهند بود تا نحوه استفاده انسان و حیوانات از حس های خود را نه تنها از دید، شنوایی، چشایی، بویایی و لامسه بلکه از حرکت و یا دما برای یادگیری در مورد محیط شان یاد بگیرد. چشم انداز بلند مدت ما این است که اشیا از انواع مختلفی از سنسور ها برای یادگیری درباره محیطش ان و واکنش به بهترین روش ممکن استفاده خواهند کرد.”
به همین ترتیب، Knowles، رهبر امروزی با ۳۹ درصد سهام بازار میکروفون MEMS، اخیرا بخش طراحی ASIC میکروفون MEMS را از Ams AG خریداری کرده است. این راهی برای وارد کردن مالکیت معنوی طراحی مدار سیگنال مختلط و مقابله با رقابت رو به رشد شرکتهای چینی مانند گوارتک و ای سی است.
مرحله بعدی میکروفنهای MEMS
بازار صوتی جهانی به مسیر رشد خود ادامه میدهد. همانطور که VPA های مبتنی بر صوت، نسبت سیگنال به نویز (SNR) بهتری را برای درک درست صدای انسان در محیط های پر سر و صدا طلب میکنند، فرصتهای جدیدی در بازار برای میکروفنهای MEMS به وجود میآید.
بنا به گفته Yole، انتظار میرود که بازار مصرف جهانی میکروفنها، میکروبلندگو و آی سی های صوتی در یک CAGR سالم ۶.۶ درصد رشد کند، یعنی از ۱۴.۱ میلیارد دلار در سال ۲۰۱۸ به ۲۰.۸ میلیارد دلار در سال ۲۰۲۴. این میکروفونها به طور گسترده مورد استفاده قرار میگیرند و به حجم بسیار بالایی میرسند. دامانوس گفت: ” ما در مورد ۶ میلیارد میکروفون صحبت میکنیم.” انتظار میرود بازار میکروفون، که در حال حاضر ۱.۷ میلیارد دلار است، در یک CAGR از ۳ درصد به ۲ میلیارد دلار در سال ۲۰۲۴ افزایش یابد.
Damianos گفت: ” این ممکن است یک رشد متوسط به نظر برسد.” اما در سالهای ۲۰۱۸ و ۲۰۱۹، بازار گوشیهای هوشمند کند شده است، احتمالا به این دلیل که گوشیهای هوشمند گرانتر میشوند و کاربران قبل از به روز رسانی آنها بیشتر منتظر میمانند. او ادامه داد: “ قبل از این، شما هر ۱.۵ سال یکبار گوشی خود را تعویض میکردید، اکنون هر ۲.۵ سال یکبار است، و در حال افزایش است.” “ما انتظار داریم که بازار میکروفن افت کند، در واقع، رشد رو به انفجار بلندگو های هوشمند، این تفاوت را جبران میکند. VPA ها باعث ایجاد میکروفونها و میکروبلندگوها در همه این دستگاهها میشوند.”
مقاله مرتبط: