在中國科學院語言聲學與內容理解重點實驗室,浪潮AGX-5支撐著數十項以音頻為核心的人工智能重大項目研究。相比原AI集群方案,AGX-5以強大的單機訓練性能,將人工智能模型的整體訓練速度提升了2-3倍。
該實驗室是我國語言聲學領域最大的國立研究機構。經過近20年發展,實驗室從最初的6人發展成為包含51名固定人員、總人數200余人的科研力量,被譽為“中國智能語音人才的搖籃”。
實驗室布局于音頻聽感知、語音識別和面向聲學應用的大數據分析等研究方向,全方位覆蓋了以音頻為核心的媒體內容理解研究內容。目前,實驗室承擔著多項國家級和國際合作研究項目,如中科院戰略性先導專項“面向感知中國的新一代信息技術”媒體內容項目、中日韓前瞻計劃A3項目“面向下一代互聯網的超臨場感聲通信應用研究”、自然科學基金杰青項目“面向語音處理的言語聲學數字化建模”、基金重大研究計劃重點支持項目“多人多方對話中的語音分離、內容分析與理解”、聲學所率先行動計劃項目“以音頻驅動的媒體深度理解關鍵技術研究“等等,科研任務十分繁重。
目前,實驗室的部分研究成果已在多個領域得到應用:在智能終端領域,推出了智能電視交互系統;在互聯網領域,先后跟百度、騰訊和阿里巴巴進行了卓有成效的合作,推出了語音輸入、語音和音樂檢索、語音客服等應用;在廣電領域,實驗室的連續語音識別引擎成為該行業主流企業的標配,被索貝、大洋集成到各自的媒資管理系統和多媒體信息檢索系統,同時也被天脈聚源在其為電視臺提供新聞素材整理服務的云平臺中采用。
(美通社,2020年9月2日北京)