هوش مصنوعی نو گوگل، می شنود، ترجمه می نماید و حرف می زند

به گزارش وبلاگ آقا ایرج، دیجیاتو نوشت: محققان گوگل از یک مدل زبانی بزرگ نو به نام AudioPaLM رونمایی نموده اند که توانایی شنیدن، حرف زدن و ترجمه دارد. این مدل که با دقت بالایی کار می نماید، از ترکیب PaLM-2 و AudioLM خلق شده است.

هوش مصنوعی نو گوگل، می شنود، ترجمه می نماید و حرف می زند

مدل AudioLM در حفظ اطلاعات زبان آوایی مانند هویت و لحن گوینده عملکرد بالایی دارد. با ترکیب AudioLM با PaLM-2، مدل AudioPaLM می تواند از تخصص زبانی PaLM-2 و حفظ اطلاعات زبان آوایی AudioLM استفاده کند تا به درک کامل تری از متن و گفتار دست یابد و بهتر بتواند آن ها را خلق کند.

بیشتر بخوانید:

  • ترسناک یا زیبا؛ آشنایی با عجیب ترین بز جهان / عکس

  • ببینید تایتان چگونه در زیر آب مچاله شد/ فیلم

فراوری متن و صدا با گوگل AudioPaLM

مدل AudioPaLM از کلمات مشترکی استفاده می نماید که می تواند هم گفتار و هم متن را با تعداد محدودی از توکن های مجزا نشان دهد. این ویژگی به مدل زبانی نو گوگل اجازه می دهد تا وظایفی مانند تشخیص گفتار، تبدیل متن به گفتار و ترجمه گفتار به گفتار را در یک معماری و فرایند آموزش یکپارچه و واحد قرار دهد.

مدل نو گوگل به خاطر ترکیب دو مدل زبانی، می تواند متن و گفتار را پردازش کند یا آن ها را بسازد. این موضوع کاربردهای AudioPaLM را افزایش می دهد و می توان از آن برای کارهایی مانند تشخیص صدا یا تبدیل صدا به متن استفاده کرد.

AudioPaLM ظاهراً در آزمایش ها در زمینه ترجمه گفتار عملکرد بهتری نسبت به سایر سیستم ها داشته است. این مدل بعلاوه می تواند گفتار را به متن ترجمه کند و چنین کاری را برای ترکیب های زبانی نو هم انجام دهد.

مدل زبانی نو گوگل می تواند صداها را براساس اعلان های گفتاری کوتاه، بین زبان های مختلف جابه جا کند. این مدل بعلاوه قادر است صداهای متفاوت را ضبط و آن ها را در زبان های مختلف بازفراوری کند.

5858

منبع: خبرآنلاین

به "هوش مصنوعی نو گوگل، می شنود، ترجمه می نماید و حرف می زند" امتیاز دهید

امتیاز دهید:

دیدگاه های مرتبط با "هوش مصنوعی نو گوگل، می شنود، ترجمه می نماید و حرف می زند"

* نظرتان را در مورد این مقاله با ما درمیان بگذارید