中國消費者報報道(記者武曉莉)10月24日,第七屆世界聲博會暨2024科大訊飛全球1024開發者節在安徽合肥開幕。活動現場,科大訊飛首發10項基于訊飛星火底座能力的硬核產品與創新應用,通過這些產品和應用,用戶可以和“自己”打視頻電話、可以和外國人自由聊天、可以“聽懂”200多種方言……國內大模型應用已走入深水區。
此次科大訊飛首發的語音視覺虛擬人交互“三合一”超擬人數字人令人驚艷。此前的多模態的交互的創新,用戶可以通過撥打“語音電話”的形式和大模型問話對答。這次,訊飛星火大模型4.0 Turbo從超擬人語音升級為超擬人數字人,用戶可以通過撥打“視頻電話”的形式和大模型問話對答。
“我們實現了語音、視頻、圖文的全部聯動的多模態交互。”科大訊飛研究院院長劉聰現場和超擬人數字人玩起了“角色扮演”游戲,無論是扮演孫悟空還是小豬佩奇,超擬人數字人的反應都惟妙惟肖。
劉聰還演示了更實用的旅游購物場景,當攝像頭轉向印有外文的化妝品及酒類產品時,超擬人數字人能對畫面中產品的品牌、功能等信息進行秒回,成為“跨語言”購物的好幫手。
202種方言實現免切換自由說
在語音識別領域,科大訊飛的遠場高噪場景語音識別領先優勢進一步擴大。此次發布的星火多語言大模型,首次實現全國地級市方言全覆蓋,含全國288個地市、202種方言。據介紹,訊飛輸入法14.0即將支持202種方言免切換自由說。
在多語種能力上,除中英文外,可支持俄、日、阿、法等8個語種。根據實用任務場景構建測試集MMT-Eval-1.0,訊飛星火在汽車、家電、辦公、翻譯等行業的任務場景應用效果超過了GPT-4o。
多模態多語言能力升級,將全面賦能汽車產業。科大訊飛還首發了汽車端側星火大模型,據悉,今年第四季度起,奇瑞、廣汽、長城等多款搭載端側大模型的車型將上市開售。

大模型賦能民生多領域AI助手
用人工智能技術解決社會剛需,是大模型應用的價值所在。此次1024科大訊飛全球開發者節上,科大訊飛面向教育、醫療、司法、政務服務、企業辦公等多個行業場景發布了最新的產品應用。
在教育行業,首次發布基于“問題鏈”的高中數學智能教師系統。結合眾多高中數學學科優秀教師集體智慧和AI大模型的機器智能,實現智能生成教學問題鏈。搭載了高中數學智能教師系統的星火智慧黑板2.0也于10月25日在第84屆教育裝備展上發布。
在醫療行業,發布訊飛星火醫療大模型2.0,以及基于訊飛星火醫學影像大模型打造的智能醫學影像助手。
在政務服務場景,政務大模型持續迭代,全面覆蓋4500多種標準化事項和60多種材料,用戶和政務大模型“聊天”就能實現邊聊邊確認辦事意圖,審核時間縮短80%,登記效率提升5倍。















