
尋找成都AI“向新力”丨近百款“成都造”備案 大模型和深度合成服務算法落地開花
本篇聚焦垂直行業大模型和深度合成算法。
尋找成都AI“向新力”丨近百款“成都造”備案 大模型和深度合成服務算法落地開花
編者按:
AI向新,融合發展。四川吹響了將人工智能作為一號創新工程的號角,成都明確提出,到2026年人工智能核心產業規模將達到1700億元,帶動相關產業規模突破1萬億元。哪些成都企業在矢志探索?有哪些值得關注的創新案例?即日起,天虎科技聯合成都科技推出《尋找成都AI“向新力”》專題,從多個維度觀察人工智能作為新質生產力帶來的增長機遇和案例,系列聚焦成都人工智能企業在垂直行業大模型和深度合成算法的創新案例,自主可控領域的融合應用創新案例,具身智能與人形機器人領域發展案例,出海創新發展案例,以及科技金融賦能成都人工智能企業發展的案例。
本篇聚焦垂直行業大模型和深度合成算法。當前,越來越多的“成都造”大模型和深度合成服務算法,正在扎實落地開花。截至2024年11月,四川有9家企業的大模型通過網信備案或審核登記,其中注冊地在成都的有8家。另有66家成都企業的84款深度合成服務算法通過備案。今年以來大模型和深度合成服務算法的成功備案或登記數量的增加,正反映了成都人工智能企業發展水平和綜合競爭力的上升。
成都66家人工智能企業
通過深度合成服務算法備案
據統計,目前我國現有完成備案并上線為公眾提供服務的生成式人工智能服務大模型200余個。四川9款大模型已通過相關備案或審核登記。
所謂備案或登記,主要區別在于適用對象不同。備案主要針對自行研發的大模型或進行了數據訓練的模型。這意味著如果一個組織或個人開發了自己的AI模型,并且該模型已經過訓練,則需要按照規定進行備案。登記則是針對接入第三方API來提供生成式服務的情況。例如,當一個應用或平臺不是自己開發模型,而是通過調用其他服務商提供的API接口來實現某些功能時,這種情況下需要進行登記而不是備案。
今年3月,國家互聯網信息辦公室發布《生成式人工智能服務已備案信息》公告,四川長虹電器股份有限公司的“長虹云帆”成功備案,是四川首個成功備案大模型。5月,“曉模型XPT”“海藝繪畫大模型”“MT-WorkGpt”等3款大模型通過備案,標志著成都行業大模型實現國家備案零突破。7月到10月,“咪咕音樂AI視頻彩鈴”“智媒大模型”“明眸大模型”“銀海聞語大模型”“智媒云大模型”等5款大模型陸續通過四川省網信辦審核登記。這些大模型的應用范圍主要是文本圖像視頻生成、電商客服、民生服務等領域。
算法方面,備案企業數量更多。截至2024年11月1日,通過梳理國家互聯網信息辦公室發布的前后八個批次的深度合成服務算法備案信息,其中屬于成都企業的84款合成算法、服務算法通過備案,主要應用于圖像合成、語音合成、文本生成、智能客服、個性化推薦等領域。
經梳理發現,已備案的84款算法來自66家成都企業。企業注冊地多在成都高新區、成都武侯區和四川天府新區,占比近九成。企業成立時間集中在2018年以后,尤其是2022年、2023年,說明成都人工智能企業近些年如雨后春筍般“冒頭”較快。
在人工智能領域,近年來成都實現多項技術在全國領先,“AI成長潛力”排名全國第二,為科技前沿產業的高質量發展提供了有力支撐。數據顯示,2023年成都共有人工智能企業852家,產業規模達780.3億元。百花齊放,各有所長,可以用來形容當下成都做大模型和算法的企業態勢。
潛在人工智能的行者AI數字文娛垂類大模型,考拉悠然的悠然多模態產業通用大模型,阿加犀智能的邊緣端開源大模型,智慧途靈的SLM知識領域模型,萬木健康的數字人驅動算法,凡瀚智創的凡瀚文本生成算法……一個個模型和算法,縱橫人工智能“江湖”。
“一厘米寬一公里深”
探索垂直落地場景應用
大模型很熱,可要實現商業化卻很難。有業內人士直言,如今是“落地為王”的階段,必須與場景相結合解決實際問題。成都人工智能企業研發的大模型和算法,在打法上更多是聚焦垂直行業,部分企業取得了不俗成績,落地應用速度明顯加快。
(一)AI+客服
AI客服問答
在主流電商平臺購物的消費者,不知不覺中其實就已經享受到了曉多科技的服務。今年雙十一期間,曉多科技以“曉模型XPT”為動力,支撐曉多機器人共接待成交訂單6537.3萬單,曉多機器人的AI貢獻率為42%,人機協同共計服務8812萬人,AI有效回復數更是達到了6.98億次。
曾在百度等領先互聯網公司效力的江嶺,2014年在成都創辦曉多科技,如今他帶領團隊走在國內智能客服機器人行業的前列。面對復雜銷售場景,智能客服在崗前、崗中均有性能提升的需求。如今,利用大模型的強上下文理解能力、總結能力和自然語言多輪對話的特性,可以幫助智能客服完成從瀏覽推薦到下單付款的購物全生命周期旅程。
“曉模型已具備強大的意圖理解、策略生成和領域知識挖掘能力,能夠為企業提供智能化、個性化的服務。業務從縱向深耕電商行業,到目前已橫向拓展到電信、政務、高校、教育等行業,目前業務遍布全國50多個城市。”曉多科技新媒體運營負責人柳傲嘉介紹。
(二)AI+數字人
數字人應用
“大家好,我是‘經經’,本區域有……”位于四川天府新區興隆湖北岸的天府數智產業園內,四川省制造業智改數轉賦能平臺的數字人“經經”正和來訪者交流。在展廳里的數字人交互一體機上,訪客通過手機掃碼,即可解鎖展廳智能講解服務。數字人“經經”將扮演導覽員的角色,以語言、圖片、視頻等多媒體形式,為參觀者提供展廳地圖、路線推薦、智能講解等全方位服務。這一場景是明途科技WorkBrain大模型、智能體技術與智能終端設備融合的成果。
明途科技是國內最早的工作AI技術研發廠商之一,作為訊飛戰略投資的成員企業,專注于智能體的核心技術研發。對普通用戶來說,智能體最常見和直觀的展現形式就是數字人。明途科技經歷了應用場景-數據沉淀-類腦模型-智能體平臺的發展過程,早在2014年基于SAAS的云工作平臺開展目標管理產品模型探索,2018年構建目標大數據中心,2020年構建類腦模型實驗室,2021年開展辦公機器人研發,2022年探索垂直模型WorkBrain,2024年推出智能體云平臺,開創領域知識注入,基于智能體虛擬社交,實現在線智能體云平臺應用。
明途科技初步選擇五大行業推進智能體數量聚集:企業、政務、文旅、教育、健康。比如明途科技為某鍛造企業打造的專家數字人,利用自然語言處理、對話生成、知識注入、私有數據訓練等AIGC技術,能將積累的鍛造經驗進行價值轉換,提供學徒培訓、答疑等多方面應用。
(三)AI+醫療
AIGC數字醫生應用
在成都高新區的一個攝影棚內,醫生只需要利用空閑時間,拍攝并選取3至5分鐘的視頻素材,萬木健康便能進行機器學習并訓練建模,生成一個高度擬真的“數字分身”。只需錄制30句語音,系統就能快速采集到醫生的聲音特征,賦予數字分身以鮮活的“人格”。再加上萬木健康為每位醫生梳理創建的知識數據模型,這樣即使是臨床一線繁忙的醫生,也能輕松打造專屬的數字化身。
萬木健康的核心團隊,既有來自成都知名獨角獸企業“醫聯”的高層,也有曾就職于華為的高級算法工程師、華西醫院臨床醫師、世界500強藥企管理層等。他們對醫生群體需求的理解非常深入。患者教育、醫生教育核心邏輯都是“以高價值醫生為中心”持續運轉,但高價值醫生核心矛盾是時間少工作忙,無法開展更多醫患互動和其他活動。
萬木健康致力打造開源的數字醫生網絡,基于真實世界中各專科醫學頂尖專家的知識經驗訓練、共創高質量模型,同時開源賦能給全國的超寫實虛擬數字人醫生,特點是“快”和“省事”。原創產品包括FTOD(Face to One Doctor)自動化患教系統、數字醫囑、數字醫生工作站等。“數字醫囑”已落地北京、上海、廣州等地多家醫院。
(四)AI+教育
AI詩歌音樂創作
大型游戲擁有龐大的數據和AI訓練潛力,正因如此,國內許多游戲公司都在轉向AI應用開發探索,滲透到社交娛樂、美術、音樂等領域。但在發展過程中面臨著商業模式選擇問題,是走游戲公司擅長的C端推廣還是偏落地應用的B端?
成都潛在人工智能科技有限公司(行者AI)的創始團隊,出自當地一家知名的游戲公司“龍淵網絡”。行者AI曾嘗試推出一款面向C端的AI音樂產品,用戶可以用它創作屬于自己的音樂,積累了10余萬的用戶量。“但發現愿意為此買單的人很少。”潛在人工智能首席運營官陳洪宇坦言,后來企業迅速做出調整,轉向打造了行者AI音樂教育平臺。
2024年,在成都七中初中學校錦城校區科技活動月期間,行者AI帶來了AI音樂教育平臺、AI美術實訓室,例如AI詩歌作曲,系統以唐詩宋詞作為歌詞原型,提供AI推薦、筆畫圖形OCR輸入等多種便捷的輸入方式,AI自動演唱、編曲、混音,可以讓學生零門檻輕松進行旋律編創,一站式地完成獨一無二的國學音樂作品。AI音樂教育平臺通過打造交互式“作詞+作曲+人聲合成+演唱”的一站式AI音樂教學方案,解決老師音樂教學中面臨的“紙上談兵”問題,實現了AI教學+AI測評的新教學模式。相關產品目前已在北京、上海、廣東、四川、云南、重慶、貴州、青海等省市廣泛應用。
(五)AI+珠寶設計
AI珠寶設計
在珠寶設計工作中,設計師常會遇到缺乏靈感、線稿轉實物圖渲染時間長、設計反復修改等問題。凡游在線科技(成都)有限公司旗下人工智能團隊——凡瀚智創,抓住行業痛點,已率先協助國內一家頭部珠寶企業探索AI+珠寶行業解決方案,滿足其包括珠寶設計、供應鏈、中臺、營銷、終端導購等全產業鏈的AI降本增效需求。
借助凡瀚智創AI+珠寶設計,能夠快速生成大量創新方案,作為設計師的靈感源泉。同時,只需幾秒就能通過設計圖,生成采用了不同材質、不同工藝的實物圖作為參考,減少反復溝通與返工。AI功能也能夠復用到更多與設計相關的工作中,例如一鍵精細摳圖、文生圖、圖生圖,生成AI人像模特、AI產品海報等。在實際應用中,凡瀚智創協助珠寶企業搭建了一套AI珠寶佩戴工作流,將AI珠寶實物圖直接佩戴在AI模特身上,節省拍攝成本,也更加直觀地展示了珠寶產品的上身效果。
目前,“凡瀚文本生成算法”已通過國家網信辦備案,該算法顯著提高文本生成場景的準確率和安全性,凡瀚智創基于此算法,能夠為客戶提供模型私有化部署方案,在為提供AI服務的同時,保證數據資產的安全。凡瀚智創為該珠寶企業打造的專屬AI廣場,就基于該珠寶企業的內部知識庫,搭建各業務模塊專屬智能體,例如BI查詢助理,準確率達到97%,但不涉及模型進行數據庫連接、插入、更新等功能,保證客戶的數據隱私。
(六)AI+城市治理
考拉悠然Micro LED設備
高速路上兩車相撞,管理單位如何第一時間感知、研判并處理?這事現在已經可以交給AI。在2024年9月,成都市大模型新技術新成果發布暨供需對接系列活動——考拉悠然專場活動上,考拉悠然依托悠然大模型及其應用平臺,發布了“悠然視界 | 高速公路智能分析決策應用”等最新的AI產品和技術成果。
據了解,該產品致力于實現全要素事件檢測與關注事件過濾,關注事件研判與交互式處置方案生成,事件處置決策方案自動執行與聯動,輔助決策者進行高效決策。該應用可通過交通事件檢測器,實時集成報警電話、道路監控等數據,全面感知交通事件,支持全部8類國標事件檢測并超過國標要求;結合部署了悠然交通大模型的交通大腦,可對關注事件進行主動過濾,有效過濾一般性交通事件90%以上;同時支持語音及視頻等交互式生成處置方案,并通過Agent聯動多終端執行,縮短交通事故研判時間30倍以上。
考拉悠然是業界領先的多模態大模型行業解決方案提供商。憑借自主研發的全球首款多模態AI操作系統——碼極客,推出了悠然多模態產業通用大模型及其應用平臺,該平臺專注于多模態行業大模型的生成及應用,可以快速構建行業AI應用,累計為國內外包括高端屏顯、半導體、煙草、軌道交通、生態環保、城市治理等行業在內的500+客戶提供了全球領先的AI產品和服務。
觀察小結:
從本文列舉的幾個創新案例,可以看到在AI+客服、數字人、醫療、教育、工業設計、城市治理等細分賽道,成都人工智能企業正在探索將通過備案的大模型或深度合成算法扎實落地。
為了使靜止的飛輪轉動起來,一開始必須使很大的力氣,每轉一圈都很費力,但是每一圈的努力都不會白費,飛輪會轉動得越來越快。作為人工智能領域的創業公司,他們的共同點都在于,核心團隊都有著長期的行業經驗和研發積累,主要基于所擅長行業開展人工智能的主場景應用,并適當延伸落地場景和范圍,有足夠的堅持并穩扎穩打,才能讓飛輪轉得越來越快。
天虎科技 楊鑫 溫彥博 羅曙馳