韩国三级一区-韩国三级香港三级日本三级la-韩国三级香港三级日本三级-韩国三级视频网站-日韩欧美一及在线播放-日韩欧美一二三区

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|低空經濟|智能汽車|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 人工智能頭條[480*270] >> 正文

盤點2024|2024年人工智能趨勢洞察:能力越大,隱憂與機遇越大

2024年12月17日 08:16  CCTIME飛象網  作 者:魏德齡

飛象原創(魏德齡/文)2024年,生成式AI迎來了從“能用”到“好用”的飛躍,徹底改變了人們對人工智能的認知。AI技術通過不斷進化的交互方式和強大的生成能力,正在深入改變人類的工作、生活以及科技生態。與此同時,生成式AI也面臨著能耗壓力、企業級落地挑戰和模型“黑盒”難題等隱憂。在新技術的推動下,AI不再是冷冰冰的工具,而是成為了生活中充滿溫度與智慧的助手。然而,這場技術革命帶來的,不僅僅是人機交互的體驗提升,更是一場從能力進化到責任擔當的深刻變革。

發展現狀:AI從未如此好用

也許在去年還有人會懷疑所謂的生成式AI無非就是一個升級版的語音助手,其背后的原理僅僅是一個無比龐大的數據庫而已。但當時間來到2024年,生成式AI通過自身的能力升級與實力展現,呈現了一個AI從未如此好用的新階段。

現狀1體驗升級:ChatGPT 4o引領新拐點

盡管有業內知情人士透露,ChatGPT 4o僅僅是OpenAI公司的一個后手,但5月13日的發布會絕對稱得上是攪動整個AI行業的一個重要時間點。

作為OpenAI 推出的全新多模態模型, GPT-4o具備同時接受文本、音頻和圖像作為輸入,并生成上述媒介輸出的強大能力。這種進步讓人機交互更加貼近人與人之間的自然對話,極大提升了語音交互體驗。GPT-4o 的響應速度極快,音頻輸入的平均回應時間為320毫秒,與人類對話的反應時間相當,而在視覺和音頻理解方面表現尤為卓越,能夠生成多種音調并帶有情感化表達。此外,該模型支持在線視頻通話,為用戶實時解答問題,并實現對話的動態打斷與流暢銜接,優雅處理語音交互中的語調、背景噪聲及多說話者情境,填補了傳統語音助手延遲大、信息丟失嚴重的體驗缺陷。與之前的語音助手(如Siri)的三階段處理機制不同,GPT-4o 通過一個統一的神經網絡直接實現音頻、圖像、文字和視頻的實時轉換,帶來全新的跨越式體驗。

GPT-4o 在性能上與 GPT-4 Turbo 不相上下,尤其在非英語文本處理、API響應速度和經濟性方面表現優異,API價格較前代降低50%。這一模型適用于文本分析、數據可視化、圖像解讀等多場景應用,且免費用戶即可體驗 GPT-4o 的強大功能,包括通過 GPTs 和 GPT Store 訪問更多工具、上傳文件獲取分析,以及利用記憶(Memory)構建個性化互動體驗。

技術升級的最直觀變化在于,通用人工智能可以低門檻的來學習用戶所提供的專業內容資料,通過這些以往難以接觸到的行業數據,來生成出更加符合使用者預期的內容,無論是文字、圖片,GPT-4o的出現讓人們見識到AI更加可用性的一面,而不再是經常出現“外行看著內行,內行看著外行”的奇怪創作表現。

現狀2用例大爆發:生成式AI融入多場景

生成式AI所帶來的用例大爆發可謂是全方位的,AI視頻生成同樣是一個十分明顯的案例。如今,人們已經偶爾會在網上看到通過AI生成的,并且內容生動有趣的視頻內容。AI視頻生成正從傳統的檢索生成和局部生成,逐步邁向依靠自然語言提示詞的全量生成。這種技術趨勢讓生成內容更加靈活和豐富,顯著拓寬了應用場景。檢索生成主要基于現有素材,通過標簽匹配和排列組合完成,具有一定效率但生成內容較受限。局部生成則能針對視頻特定部分進行編輯,例如調整角色、背景、風格或添加特效,雖有創意性提升,但依然局限于預設元素。相比之下,提示詞生成基于大規模模型,借助自然語言輸入即可生成全新的視頻內容,包括風格化場景、藝術效果或動畫設計,極大擴展了創作空間和靈活性。這種新技術不僅提升了生成效率,還大幅降低了成本,為多領域應用提供了無限可能。

國內的生成式AI產品同樣能夠看到從能用到好用的趨勢,科大訊飛發布的訊飛星火大模型4.0 Turbo在數學能力和代碼能力上取得了重大突破。根據行業實用數學任務構建的測試集CAppliedMath-1.0,訊飛星火4.0 Turbo在計算、財務、金融、度量等多個維度的任務中均超過GPT-4o水平,已完成超長思維鏈、樹搜索和自我反思評價等算法驗證;根據代碼生成HumanEval測試集上的效果對比,訊飛星火4.0 Turbo在Python、Java、JavaScript等任務上和GPT-4o的差距微弱,在C++能力上超過GPT-4o,同時推出星火代碼7B版本,滿足代碼生成、代碼補全等極速響應型任務,效果業界最優。

2024年,生成式AI技術正快速從“能用”邁向“好用”和“實用”,以GPT-4o和訊飛星火大模型4.0 Turbo為代表的新一代多模態模型,顯著提升了跨媒介交互體驗、生成效率及準確性,廣泛應用于文本分析、數據可視化、代碼生成等領域,推動了AI更貼近人類需求的全面發展。然而,在技術持續突破的同時,AI的發展也面臨諸多挑戰,例如高能耗帶來的環境負擔、模型思維過程的“黑盒”特性導致的透明性不足,以及如何在企業級場景中實現更高價值的落地。

挑戰:能力越大,隱憂越大

在超級英雄電影中,有這樣一句膾炙人口的臺詞:“能力越大,責任越大”。不過,對于AI來說,隨著能力的增強,所對應的責任一面,也同樣代表著隱憂。下面的這一年中觀察到的問題,也同樣是業界在反復熱議的話題,AI的隱憂主要表現在三個問題上:

挑戰1算力與能耗:失效的摩爾定律

無論是云端AI還是端側AI,都正在讓摩爾定律失效,盡管AI的性能擁有可見性的飆升,但不妨重溫下該定律的全部描述:“‌半導體芯片上集成的晶體管數量每隔18到24個月翻一番,性能提升一倍,價格下降一半的現象。”如今AI性能提升的背后,并不意味著價格或是成本會相對進行下降,代工制程升級的成本水漲船高,云端AI的提升方式也更多依賴于更多的GPU數量,并對應了更大的能耗。

人工智能的掣肘之處已經凸顯,那就是能耗問題。本質上來說,ChatGPT的強大表現表源自于“大力出奇跡”。根據估算,GPT-4可能使用了約10,000至25,000張A100顯卡完成訓練,而Stability AI則使用了約5,000張A100,Falcon-40B僅需384張A100即可完成訓練。相比之下,Inflection通過3,500張H100顯卡訓練出了與GPT-3.5能力相當的模型。據業內人士透露,GPT-5的訓練可能需要30,000至50,000張H100顯卡,這一數字遠超現有模型的資源需求,進一步凸顯了先進AI模型對計算力的極高依賴。

算力增長所對應的便是能耗。預估GPT-6的耗電將達700萬度。相比大型AI系統的百萬瓦級功耗和海量數據需求,而人類大腦則能以很小樣本和30瓦功耗實超高計算效率和識別。

這就意味著,AI算力背后所依附的數據中心正在面臨巨大的能耗壓力。有數據統計顯示,中國的數據中心正在面臨巨大的能耗問題,在2022年已經接近2700億度的用電,預計到2025年會翻倍,達到4000億度電。這就意味著,到2025年,中國數據中心的能耗約等于4個三峽或葛洲壩的發電總量。

如果找不到解決途徑,算力的盡頭將會是能源。

挑戰2難有大作為的企業級領域

如今GenAI作為一種新的產品賣點,在消費電子領域確實風生水起,產品邏輯多為通過生成式能力帶來如系統交互、圖片處理、文字信息匯總等方面的升級。然而,當類似的邏輯應用于企業級領域的時候,GenAI技術本身目前的種種不足之處,卻會被放大,從而成為了落地過程中的掣肘。

最大問題便是所謂的致幻率問題,“一本正經胡說八道”的情況在消費電子領域或許可以被用戶一笑了之,但在IT運營管理的過程中,卻可鑄成大錯,當ToB領域對于安全性和準確性的要求變高,以及對高可靠性的要求,就難以有過多的容錯性。從而導致GenAI的方案可能難以被廠商最終采用。

準確性問題顯然與訓練數據的專業性與量級存在強關聯,但企業往往并不愿意對外分享數據,如何在構建便利AI條件的情況下來平衡安全性和隱私性成為了比較大的挑戰。在使用相關GenAI來實現產出的時候,知識產權問題也應運而生,生成的圖像、歸納的總結、構建的代碼的知識產權到底屬于誰,企業對于此類的擔憂同樣一直與GenAI的發展而相生相伴。

GenAI的出現也在打破企業內部的一些邊界,對于員工而言很容易自然而然地把如會議紀要、產品資料等內容上傳在云端AI來快速獲取會議總結。企業難以遏制這種員工簡化工作流程的渴望,但對于合規與安全性又提出了更大挑戰。

這無疑影響了企業對于部署相關落地方案的決心與判斷。而從很多企業在今年所對外提供的AI解決方案也不難發現,在產品功能上多聚焦于通過自然語言來優化操作流程,并一般會避免讓A涉及到相關決策的環節,此舉無疑也映襯了廠商對于自身產品信心的不足,顯示出企業級應用仍有較長的探索與完善之路。

挑戰3神秘的思維黑盒

隨著生成式GenAI和深度學習模型的廣泛應用,其強大的能力在自然語言處理、醫療診斷、自動駕駛等領域展現出巨大潛力。然而,這些技術的核心問題之一——思維“黑盒”特性——正在引發越來越多的關注。所謂“黑盒”,是指這些模型的推理過程高度復雜、難以解釋,對其內部決策邏輯的透明度存在重大欠缺。這種特性不僅引發了學術界對AI可解釋性的討論,也對其在關鍵行業中的應用構成了顯著障礙。

大模型的“黑盒”特性源于其設計與運行方式。首先,模型通過多層神經網絡捕捉數據中的復雜模式。這些多層抽象形成的高層次內部表示往往不具備直觀的語義信息,難以被人類理解。其次,大模型采用分布式表示,信息以神經元激活模式的形式存儲,任何單一神經元都無法直接對應具體的特征或概念。此外,非線性激活函數引入的非線性變換,使得模型在面對輸入數據微小變化時可能產生難以預測的輸出。最后,端到端學習方式雖然省去了人工設計特征的步驟,卻將特征提取與決策過程緊密集成,進一步加劇了模型的不透明性。

黑盒特性在某些關鍵領域可能會引發一系列問題。例如在自動駕駛領域,黑盒模型可能在突發情況下做出難以預測的決策,例如在面對未知路況或標志時,模型的錯誤反應可能直接導致安全事故;蚴窃谀壳罢诖罅繃L試融入AI能力的金融行業,黑盒模型如果被用于信用評估或風險管理,可能無法滿足監管機構的合規性要求,原因在于一旦模型拒絕了某一貸款申請,銀行卻無法提供拒絕理由。

盡管黑盒問題尚未徹底解決,學界和業界正在積極探索可能的解決方案。一些研究者嘗試通過可視化技術和模型簡化來揭示模型的內部結構,另一些人則采用基于知識的解釋方式,為模型的決策提供更加直觀的解釋。

在相關技術實現之前,AI的黑盒特性仍是限制其在高風險領域大規模應用的重要因素。

趨勢洞察:無限可能的AI未來

假如能力的另一面是隱憂的話,隱憂所對應的則是需求與機遇。面向即將到來的2025年,AI的未來將會繼續引發出無限的可能性。在此,根據市場風向,可以預測以下三大趨勢:

趨勢1端側AI繼續牙膏爆擠

上文中已經提到了云端AI所帶來的在數據中心側的壓力,與此同時當AI開始與眾多行業產生深度融合,對于時延性的要求也在提升,如果是像使用云端AI助手時的轉圈圈般的響應表現,甚至可能會引發安全隱患。

例如在通信領域,將AI融于AI系統設計之初幾乎已經成為業界的普遍共識。但在對于AI與通信融合的思考中,接入網的實時性要求,也對AI在處理海量數據時的響應速度提出了很大挑戰。如今以智能手機處理器在端側AI上的成果無疑提供了對應的解題思路。有預測表示,未來的6G終端將利用端側AI能力,能夠在本地處理大量數據,而不需要跟云端做過多的互通操作,這樣既可以保護隱私,又可以提高響應速度。

端側AI的算力也在顯著提升,并且沒有依賴于更高的能耗。以驍龍8至尊版為例,搭載的全新架構Hexagon NPU性能提升了45%,能效提升45%,基礎大語言模型上的token生成速率提升了高達100%?焖夙憫矫,在目前業界流行的一些大語言模型上,驍龍8至尊版的處理速度達到超過70 tokens/s。在MLPerf BenchMarks測試中,相比驍龍8 Gen3,性能提升達到了104%。

受益于端側AI能力的不止于智能手機。在汽車領域,驍龍座艙至尊版集成的最新NPU,其性能相比8125提升至最高12倍,能夠處理高達幾十億參數的大語言模型,通過搭配檢索增強生產技術,以及基礎模型,能夠實現車輛維修助手、故障分析、問題上報等功能。在PC領域,驍龍X Elite 45TOPS的NPU算力和異構計算架構,為開啟終端側生成式AI體驗提供了優勢,讓驍龍X系列成為支持首批Windows 11 AI PC的平臺,讓個人用戶體驗更加智能和個性化。高通還在投資日期間透露了第三代Oyon CPU架構的相關信息,預計明年在AI性能上還將帶來進一步的提升。

趨勢2功能從設想到現實

關于AI的設想,業界已經開始試圖利用這項技術跳脫出以往思維的窠臼。變革傳統的交互方式就是一項正在從設想走向現實的案例進行時。其背后的技術根基在于AI已經具備了看得懂、聽得懂、能理解的基本功,使其能夠實現以往語音助手所不能達到的高度。

2024驍龍峰會上,高通總裁安蒙拋出了這樣一個觀點,他認為隨著AI將在終端設備上所帶來的體驗維度升級,所謂的“殺手級應用”概念將不復存在,它只是一個過去式的思考問題的角度。未來,每個應用都將借助AI實現融合與互通,具備“殺手級應用”的潛力。2023年,他還曾就這一設想表示:“AI引擎在終端運行與云端交互,你可以在終端本地運行一個應用,或者終端按照你的需求去云端交互。至此,大家看到了5G和AI是如何把一切都連接到一起。盡管我們有一個以應用為中心的終端,但不一定需要所有應用,它和云端整合就知道你的需求,你可以在終端或者云端上挑選應用!

在這一設想的落地方面,榮耀已經成為最具代表的產品。其手機產品中的AI智能體,帶來了“一句話關閉自動續費”“一句話點飲品”“一句話旅行規劃與訂票”等顛覆性端側AI體驗,甚至在其中還能選擇出用戶最喜歡的產品類別,比如是美式還是拿鐵。Copilot+PC也正在煥發出新的潛力,用戶可以僅僅通過一張兒童畫般的草圖生成出海邊的風景,任意搜索全部文檔中的信息內容,無論是文字、圖片,或是僅僅是一種關于物品的形容。以及在離線狀態下,也能即刻生成出相關美食必吃榜推薦的AI助手。

這種交互方式的變革已開始在企業級應用中出現,同樣是通過自然語言的方式來簡化運維過程中的操作。例如元景2.0中通過采用自適應的表格拆分和整合,自動補齊了表頭和標題等信息,使表格問答的準確率提升了20個百分點;針對車牌號、故障碼等字符串查詢“找不對”的問題,元景2.0采用多路檢索融合的方式,使回答準確率提升近20個百分點。

隨著AI技術的快速發展,傳統的交互方式正在被重新定義,從設想到現實的轉變已然開始。在終端設備和云端深度融合的驅動下,AI不僅提升了用戶體驗的高度和廣度,也拓展了技術的應用邊界。無論是在消費級市場上實現“一句話解決”的便捷操作,還是在企業級場景中優化復雜任務處理流程,AI都展現出了強大的變革潛力。可以預見,未來的技術生態將以更加智能、個性化和高效的方式重塑人類與設備、服務的關系,真正實現“所想即所得”的數字化生活與工作體驗。

趨勢3企業級用例靜待花開

盡管企業級AI解決方案面臨種種技術本身的制約,但這一市場無疑在近年來成為了聚焦點。原因在于企業對于通用AI平臺難以建立信任,獨立定制的解決方案,由于采用了相對隔離式且專業度更高的數據庫,提升了隱憂之下的信心。

很多商業AI的底氣在于數據,這意味著AI和一個企業的業務流程、運營管理深度融合,充分挖掘利用企業內部和行業的數據,釋放數據的價值和潛能,讓企業的決策運營更卓越、更智能,讓商業社會更高效。部分公司對于致幻問題的解決方式在于用企業核心的業務數據進行訓練,而且是一個真實的、實時的、準確的業務數據來訓練這個模型。

針對不同行業需求的定制化設定也是企業級AI們所集中表現出的特色,以思特奇九思⼤模型為例,為企業提供開發態、訓練態、運⾏態、運營態的全⽣命周期能⼒⽀持。針對特定⾏業和企業數據進⾏模型訓練,思特奇構建1套智算基礎設施、1套⼤模型通⽤平臺、N個AI技術能⼒、X個應⽤場景的思特奇⼈⼯智能體系總體架構。

在安全領域,以AI對抗AI的概念同樣成為了新的共識性路徑。未來將成為AI對抗AI的時代,不可能光靠人力去進行事件響應,必須用AI來協助。網絡安全企業的產品框架中通過專為實現卓越安全分析與威脅防護而構建的即開即用AI模型,安全團隊能夠創建自己的ML模型并將其集成到架構體系中,從而實現欺詐檢測、安全研究、復雜數據可視化等獨一無二獨特的用例。

未來,企業級AI產品的發展將更加注重深度融合和個性化定制,以滿足不同行業和場景的復雜需求。AI不僅將成為企業生產力提升的核心驅動力,還將在業務創新中扮演重要角色。從定制化模型到實時數據驅動的智能決策平臺,企業級AI有望打破傳統工具的局限,成為企業管理和運營的全方位助手。

隨著AI技術的成熟,企業將更傾向于構建專屬的私有化模型和獨立的智算基礎設施。這種模式能夠在保護數據隱私的前提下,充分挖掘數據價值,實現更高效的資源調配和風險控制。此外,隨著邊緣計算和混合云技術的普及,AI在企業級應用中的分布式部署能力將進一步增強,為跨部門、跨區域的智能化協同提供技術保障。

結語:

生成式AI的迅速發展為各行業帶來了無限可能,也提出了新的挑戰。從多模態模型的跨越式提升到企業級場景中的深度融合,AI正在以更貼近人類需求的方式展開全面賦能。盡管面對能耗、隱私、可信性等諸多難題,這些技術正在推動全行業的數字化轉型與創新?梢灶A見,在接下來的發展中,生成式AI將通過更智能、更高效的應用場景,將“技術想象”變為“現實可能”,為未來社會構建一個更加智能、便捷和可持續的世界。

編 輯:章芳
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
中國移動副總經理張冬:5G揚帆開新篇,數智遠航啟新程
精彩專題
2024通信業年終盤點
2024數字科技生態大會
2024年度中國光電纜優質供應商評選活動
2024全球6G發展大會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像