4月20日,出門問問在北京舉辦主題為“AGI·降臨”的2023 AIGC戰(zhàn)略發(fā)布會。出門問問宣布內(nèi)測探索大模型「序列猴子」,并提出CoPilot將無處不在,同時在大模型能力的基礎(chǔ)上同步開啟面向創(chuàng)作者的CoPilot產(chǎn)品矩陣,面向C端的升級版語音助手魔法小問,以及面向B端的企業(yè)專屬大模型的內(nèi)測探索。
其中面向創(chuàng)作者的CoPilot產(chǎn)品矩陣包含四款A(yù)IGC產(chǎn)品,分別為AI寫作平臺“奇妙文”、AI繪畫平臺“言之畫”、AI配音平臺“魔音工坊”、數(shù)字人視頻與直播平臺“奇妙元”。
出門問問大模型“序列猴子”是一款具備多模態(tài)生成能力的大語言模型,模型以語言為核心的能力體系涵蓋“知識、對話、數(shù)學(xué)、邏輯、推理、規(guī)劃”六個維度,能夠同時支持文字生成、圖片生成、3D內(nèi)容生成、語音生成和語音識別等不同任務(wù)。
目前,“序列猴子”大模型已經(jīng)具備了一定的自然語言理解、知識、邏輯以及推理等能力,對于“湖南和湖北哪一個省會的人口更多?”這類邏輯問題能夠快速給出準確結(jié)果。
據(jù)介紹,出門問問自研大模型中文名“序列猴子”的靈感,來源于數(shù)學(xué)家埃米爾·波雷爾在20世紀初提出的“無限猴子”定理。根據(jù)該定理,如果一群猴子隨機地敲打一臺打字機,最終一定會產(chǎn)生完整的莎士比亞作品。這個定理基于概率論和組合數(shù)學(xué),闡釋了概率的統(tǒng)一性。出門問問自研大模型的構(gòu)建原理與“無限猴子”類似,海量文本序列通過出門問問自主算法的不斷訓(xùn)練,經(jīng)由大規(guī)模算力消化理解,便練成了“序列猴子”。
出門問問創(chuàng)始人兼CEO李志飛表示,大模型不只是參數(shù)量大,當(dāng)今的大模型是互聯(lián)網(wǎng)文本的深度建模,而互聯(lián)網(wǎng)文本是世界知識的映射,因此大模型是一個認知模型,是對語言的建模。而語言是思維的邊界,所以大模型擁有無限想象空間。“序列猴子”在訓(xùn)練過程中已經(jīng)展現(xiàn)出了“涌現(xiàn)”能力,目前正處于“頓悟”階段,未來提升的速度會越來越快。他還認為,做人類的CoPilot會是大模型最好的“工作”,未來CoPilot將無處不在。
一站式CoPilot產(chǎn)品矩陣,打通內(nèi)容創(chuàng)作全流程
基于“序列猴子”大模型,出門問問內(nèi)測探索了多款面向創(chuàng)作者的AIGC產(chǎn)品及應(yīng)用,為萬千創(chuàng)作者構(gòu)建一站式CoPilot產(chǎn)品矩陣,打通內(nèi)容創(chuàng)作全流程。目前出門問問已實現(xiàn)技術(shù)、產(chǎn)品、商業(yè)化的「三位一體」,注冊用戶超500萬,全球付費用戶超百萬。
奇妙文-你的AI寫作助理(write.mobvoi.com)
作為發(fā)布會上首個亮相的CoPilot產(chǎn)品,“奇妙文”的AI寫作能力覆蓋了職場辦公、市場營銷、新媒體和創(chuàng)意寫作四大內(nèi)容創(chuàng)作場景,能夠在用戶撰寫年終總結(jié)、客服話術(shù)、劇本、廣告文案等內(nèi)容時,為其源源不斷地提供靈感和創(chuàng)意方向。
為更好幫助用戶提升內(nèi)容創(chuàng)作效率,“奇妙文”開放了八大AI編輯功能,分別為風(fēng)格轉(zhuǎn)化、要點提取、校對糾錯、續(xù)寫、改寫、擴寫、縮寫、翻譯。“奇妙文”還能在寫作中自動生成圖片,為用戶帶來圖文并茂的寫作體驗。
言之畫-你的AI繪畫助理(paint.mobvoi.com)
面對設(shè)計師、插畫師等在文字外對設(shè)計有強烈需求的創(chuàng)作者,出門問問內(nèi)測探索了“言之畫”AI繪畫平臺。“言之畫”支持二次元、蒸汽朋克、插畫等8種創(chuàng)作風(fēng)格。用戶只需輸入文字,“言之畫”就能一次性生成8張光影逼真、細節(jié)豐富的2K高分辨率圖像。
除了以文生圖,它還擁有以圖生圖、動圖生成、個性頭像生成等AI繪圖能力,極大豐富了用戶的創(chuàng)作手段。對于企業(yè)用戶,“言之畫”還支持專屬模型定制,讓企業(yè)用戶能夠根據(jù)自身需要自定義模型風(fēng)格,并且支持多人協(xié)作生產(chǎn),更好地滿足企業(yè)的繪圖需要。目前,“言之畫”已經(jīng)與家裝設(shè)計平臺酷家樂達成了探索意向,在酷家樂平臺上,用戶們借助“言之畫”只需用文字描述出自己的需求即可輕松更換裝修風(fēng)格、調(diào)整家具位置等,進而設(shè)計出自己喜歡的裝修方案。
面向AI配音場景,出門問問推出了新一代AI配音產(chǎn)品“魔音工坊”。“魔音工坊”(海外版DupDub)是一款全球領(lǐng)先的全流程一站式AI配音平臺,已向用戶開放了超1000種音色、超2000種聲音風(fēng)格、40國語言和11種方言。
在大模型技術(shù)的加持下,“魔音工坊”是全球首款搭載了大模型AI寫作功能的配音平臺,覆蓋了AI寫作、AI配音和剪輯等多個場景。用戶可以在它的輔助下輕松完成影視解說、有聲書、在線教育、新聞播報等集文案與配音于一體的內(nèi)容創(chuàng)作。目前,“魔音工坊”已經(jīng)與微信讀書、少年得到、大眾等多個行業(yè)的頭部企業(yè)達成了合作。
為了給用戶提供更好的配音體驗,“魔音工坊”支持對選定聲音進行包括平靜、悲傷、開心在內(nèi)的7種情緒的調(diào)節(jié),對包括女中年、男孩等在內(nèi)的10種角色進行遷移,同時還開放了韻律調(diào)節(jié)、局部變速、多人配音等AI聲音個性化編輯功能,讓用戶能夠像用word編輯文檔一樣編輯聲音。除了選擇聲音、編輯聲音,基于大模型的語言生成能力,“魔音工坊”還將推出“捏聲音”功能,用戶可以自由選擇性別、年齡、語言、風(fēng)格和情緒等聲音特征,從0到1創(chuàng)作自己喜歡的聲音。
奇妙元-你的AI數(shù)字分身(weta365.com)
在文字、圖像、聲音等生成能力基礎(chǔ)上,為了讓視頻內(nèi)容創(chuàng)作者更快更好地創(chuàng)作形式新穎、生動有趣的作品,出門問問內(nèi)測探索了AI數(shù)字形象創(chuàng)作及直播平臺“奇妙元”。
據(jù)介紹,“奇妙元”平臺現(xiàn)有超100款數(shù)字人、超1000款3D數(shù)字資產(chǎn)、超1000種聲音。憑借多模態(tài)生成技術(shù),“奇妙元”平臺目前共支持圖片建模(2D數(shù)字人)、視頻建模(2.5D數(shù)字人)、3D建模 (3D數(shù)字人)三種不同形式的數(shù)字人生成。其形象克隆功能,僅需一段5分鐘的真人視頻素材,就可以1:1復(fù)刻用戶的形象神態(tài),為用戶打造聲音一致、動作自然的數(shù)字人分身。
從個人到企業(yè),CoPilot將無處不在
出門問問在語音助手領(lǐng)域有著深厚的積累,對AI語音的研究可以追溯至十年前,2014年出門問問發(fā)布了首款語音助手“小問助手”,2015年迭代了“小問秘書”,2017年推出了全場景VPA,并在2019年對VPA進行了升級。經(jīng)過十年的積累和發(fā)展,本次發(fā)布會上出門問問內(nèi)測探索的CoPilot-魔法小問,可以理解為Siri與ChatGPT的綜合體。
“你好問問,最近的火鍋店在哪里”、“”你好問問,告訴下明天北京的天氣吧”,人們都習(xí)慣于在衣食住行前先查詢了解相關(guān)信息。作為面向個人用戶開發(fā)一款智能語音助手,“魔法小問”可以幫助用戶查百科信息、查天氣、查餐廳、查酒店,還能與用戶自由對話,讓用戶更方便、快捷地獲取信息。
據(jù)出門問問介紹,“CoPilot”源自超級助理的概念,它將擁有基于大模型的高智商大腦,能夠分析海量數(shù)據(jù)即時準確地與人類交流;還會擁有動聽的聲音、靚麗的形象,可以搭載任意硬件平臺,如手機、手表、車機等;還能夠適配千行百業(yè),化身高質(zhì)量教學(xué)的老師、知識淵博的律師、專業(yè)的醫(yī)生、金融理財客服等,在需要的時候,隨時隨地展示專業(yè)知識,為人分擔(dān)壓力。
「序列猴子」開放生態(tài),賦能更多行業(yè)
基于“序列猴子”大模型的底層能力,對于B端用戶和垂直領(lǐng)域,“出門問問Copilot”不僅提供通用能力支持服務(wù)和數(shù)字人形象定制服務(wù),還將開放自身角色能力,持續(xù)迭代數(shù)據(jù)接口。有需求的企業(yè)用戶可以登陸web端調(diào)用API服務(wù),并且能通過上傳文檔的方式,對行業(yè)專有內(nèi)容進行訓(xùn)練,從而實現(xiàn)定制化語音交互。序列猴子的網(wǎng)址為openapi.mobvoi.com。
目前,出門問問已經(jīng)與首批十大行業(yè)的內(nèi)測探索伙伴達成了合作,包括汽車、教育、律所、金融、醫(yī)療、旅游等,未來出門問問“CoPilot”將逐步賦能更多行業(yè),助力更多企業(yè)擁有自己的專屬大模型,打造自己的專屬“CoPilot”。