2025年初,開源大模型DeepSeek迅速從科技界擴展到所有經(jīng)濟領域,成為提升經(jīng)濟效率和增長的新基石。麥肯錫報告指出,大模型和生成式AI可推動全球生產(chǎn)力每年提升0.1%-0.6%。高盛今年3月預測,DeepSeek-R1的普及有望在未來十年內(nèi)推動中國上市企業(yè)股票整體盈利每年提高2.5%。
大模型與生成式AI無疑已經(jīng)成為實實在在的效率和增長引擎,而DeepSeek的問世則證明了算力和算法對于大模型普及的制約正在迅速降低,規(guī)?;母哔|(zhì)量標注數(shù)據(jù)特別是行業(yè)垂直領域(垂類)數(shù)據(jù),正在成為大模型普及的下一個戰(zhàn)場。2025年2月底澳鵬發(fā)布的年報顯示:2024年公司中國業(yè)務營收突破4.2億,年增長達到71%,其中的大模型/AIGC業(yè)務增長了526%,幾乎所有AI龍頭,特別是大模型AI企業(yè)都成為了澳鵬的客戶。
圖片來源:Appen公司2024年財報,單位:百萬美元
澳鵬Appen全球高級副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示,在大模型啟動AI數(shù)據(jù)服務超級周期的大門時,全球“知識”資源+高速技術(shù)迭代+高安全合規(guī)正在重新定義AI數(shù)據(jù)服務行業(yè),所有的供應商都被重新洗牌,傳統(tǒng)人力資源型服務商正被迅速邊緣化,全力投入高質(zhì)量技術(shù)研發(fā)和產(chǎn)品、實現(xiàn)供給全球“知識”資源、確保國內(nèi)外數(shù)據(jù)合規(guī)和安全的AI數(shù)據(jù)服務商才能真正接住超級周期的大盤。澳鵬中國將持之以恒地全力投入技術(shù)研發(fā)、垂直領域、全球資源布局和數(shù)據(jù)合規(guī)與安全等方向,與AI龍頭企業(yè)一起夯實新十年的增長路徑。
超級周期正式啟動
2022年底,ChatGPT橫掃全球,開啟了全球AI超級周期的序幕。高盛2025年2月的研究顯示,自2022年11月ChatGPT面市以來,美國股市飆升50%,科技股市值增加13萬億美元,催生了美國歷史上最強勁的牛市之一。而開源大模型DeepSeek引領的第二波浪潮,以更低成本實現(xiàn)接近GPT-4和Claude的高性能,加速了全社會對大模型的采用。到2025年2月,全球已有超過200家公司接入DeepSeek,涵蓋互聯(lián)網(wǎng)巨頭、電信運營商、金融科技企業(yè)、車企及政府部門。
澳鵬Appen全球高級副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示,與全球大模型更側(cè)重通用性和多語言多語種模型泛化的模式不同,中國大模型更側(cè)重“通用+垂直領域”,這意味著中國大模型在未來行業(yè)應用場景、特定垂直領域創(chuàng)新方面獨樹一幟,也更在“局部領域”更容易實現(xiàn)AI垂類實踐的突破,對特定行業(yè)和社會生產(chǎn)力的大幅快速提升。
在通用領域,中國大模型取得了顯著突破。根據(jù)智源研究院2024年底的“百?!痹u測,豆包文生圖模型和視頻生成模型分別位列全球第二,騰訊Hunyuan Image文生圖、快手可靈1.5文生視頻、阿里巴巴Qwen2-Audio語音語言水平均位居全球第一。在垂直領域,以DeepSeek為代表的中國大模型正深入傳統(tǒng)行業(yè),如多地12345熱線接入后效率大幅提升,鎮(zhèn)江超級大腦單日數(shù)據(jù)處理量相當于全市公務員10年工作量,天津地鐵接入后故障發(fā)生率降低50%等等。
在DeepSeek等一系列AI大模型創(chuàng)新影響下,技術(shù)進步、應用生態(tài)、生產(chǎn)關系和生產(chǎn)力變革這三者正在形成閉環(huán)共振,形成從技術(shù)進步到生產(chǎn)力提升的“超級周期”,其中包括了超級AI周期、超級經(jīng)濟周期以及激活的超級AI數(shù)據(jù)服務周期。Gartner在2025年2月發(fā)布預測,認為到2028年,中國企業(yè)對人工智能就緒型數(shù)據(jù)(特別是非結(jié)構(gòu)化數(shù)據(jù))的投資將達到2024年的20倍!
AI數(shù)據(jù)服務市場洗牌,行業(yè)龍頭浮出水面
作為AI數(shù)據(jù)服務行業(yè)龍頭企業(yè),澳鵬Appen公司的2024年全年報顯示,經(jīng)調(diào)整后的公司年增長16%、2024年下半年大模型收入占28%。在澳鵬中國,大模型及大模型相關業(yè)務已經(jīng)占據(jù)了營收的40%。澳鵬自2023年中旬推出大模型相關產(chǎn)品和服務,僅僅一年多的時間發(fā)展成為了第一大業(yè)務,用“爆發(fā)”形容并不為過。2024年,澳鵬中國全年實現(xiàn)了4.2億人民幣營收,其中大模型及大模型相關業(yè)務營收達到1億人民幣。
澳鵬Appen全球高級副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示,“大模型對于AI數(shù)據(jù)服務的綜合能力的要求比過去上了幾個臺階,億量級別數(shù)據(jù)(知識)的采集標注、數(shù)據(jù)高質(zhì)量的精細化管理、數(shù)據(jù)復雜度和多樣性與模型泛化的矛盾、國內(nèi)外數(shù)據(jù)安全與合規(guī)風險的升級、海外標注交付能力等等,都要求服務商具備更強的技術(shù)能力、平臺與產(chǎn)品,‘全球+技術(shù)+管理+垂類知識'的多維AI數(shù)據(jù)服務模式將逐步淘汰過去的單純的低端人力資源、單一區(qū)域密集型模式。”
“出?!焙腿蚧侵袊鳤I客戶的戰(zhàn)略布局之一。澳鵬中國目前在全球有9大高信安交付基地,布局北美、歐洲、東南亞、中國等,同時更有覆蓋170+國家,290+種語言的超百萬的眾包資源,已經(jīng)是中國頭部的AI客戶在海外市場的“攻城略地”的長期和信任AI數(shù)據(jù)合作伙伴。田小鵬博士認為:“真正的AI市場,不僅在國內(nèi),更在廣闊的全球?!?/p>
澳鵬是少數(shù)最早投資技術(shù)和技術(shù)平臺的AI數(shù)據(jù)標注服務商之一,澳鵬中國自2019年成立以來十分堅定投資技術(shù),成立5年來向技術(shù)研發(fā)投資了1.1億人民幣,先后開發(fā)了MatrixGo企業(yè)級高精度數(shù)據(jù)標注平臺以及大模型智能開發(fā)平臺,通過雙技術(shù)平臺的建設,實現(xiàn)了效率、質(zhì)量和安全性方面的顯著優(yōu)勢,搶得了市場先機。
大模型對于標注數(shù)據(jù)的范圍、量級和復雜性要求,遠遠超過了之前的AI小模型。田小鵬博士認為:原先的AI小模型都是項目制,而大模型是一個世界通用模型,要解決所有人類的問題甚至是對未來的思考,涉及范圍“匪夷所思”、遠超想象;大模型對于標注數(shù)據(jù)量級要求則是上億條甚至是幾十億條的海量級,遠超之前AI小模型的幾百、幾千條;而基礎大模型的學習速度非??欤粌赡陜?nèi)就能消耗完所有的公開信息,接下來的難點在于專業(yè)和私域數(shù)據(jù)。
正是由于大模型對于標注數(shù)據(jù)的要求直接從TB級躍升到PB級、從單一模態(tài)和簡單標注跨越到多模態(tài)數(shù)據(jù)(文本、圖像、語音等)和復雜的標注任務(如多輪對話、思維鏈標注等),急需金融、法律、醫(yī)療、音樂、文學、數(shù)理、代碼、美學藝術(shù)等垂直領域的更高水平的專業(yè)知識等,這些都要求數(shù)據(jù)標注服務商具有強大的技術(shù)平臺和研發(fā)能力,通過智能化的標注平臺承載大模型“匪夷所思”的需求。除了開發(fā)智能標注工具和平臺外,澳鵬對技術(shù)的投資還包括構(gòu)建多模態(tài)數(shù)據(jù)湖,統(tǒng)一管理文本、圖像、音頻等異構(gòu)數(shù)據(jù),支持靈活的數(shù)據(jù)組合與實驗,以及強化倫理與合規(guī)框架等。
自2023年率先在AI數(shù)據(jù)服務行業(yè)中推出大模型智能開發(fā)平臺以來,幾乎所有的互聯(lián)網(wǎng)、科技、AI和大模型頭部客戶都找到了澳鵬,與澳鵬團隊捆綁式緊密合作,共同應對大模型的數(shù)據(jù)洪流。例如,基于澳鵬大模型平臺多模態(tài)數(shù)據(jù)處理能力,澳鵬為某AI科技廠商提供圖像文本描述數(shù)據(jù)服務工作,提供高質(zhì)量圖文對超過50億對,充分滿足了圖文大模型的數(shù)據(jù)需求。正是“笨鳥先飛”,提前“押注”投資技術(shù)和研發(fā),讓澳鵬在行業(yè)洗牌中脫穎而出,躍升為行業(yè)龍頭。
戰(zhàn)略投資兩大方向,布局新十年超級周期
雖然公司在2024年取得了跨越式發(fā)展,但澳鵬Appen全球高級副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士認為,以DeepSeek等大模型為代表的大模型紅利才剛剛開始,AI數(shù)據(jù)服務行業(yè)將進入10-20年的景氣周期,澳鵬中國將在技術(shù)、交付、安全和渠道等方向持續(xù)布局,其中的戰(zhàn)略重點是技術(shù)和交付。而澳鵬作為AI數(shù)據(jù)服務行業(yè)的龍頭,其面向未來十年超級周期的布局,也將影響整個行業(yè)的發(fā)展方向。
澳鵬(中國)在2024世界人工智能大會(WAIC2024)
技術(shù)和研發(fā)是澳鵬中國持續(xù)性戰(zhàn)略投資的重要方向。田小鵬博士表示,技術(shù)是絕對生產(chǎn)力,未來5年,澳鵬中國將向研發(fā)再投入2-3億元人民幣,以確保公司在大模型超級周期中的持續(xù)競爭力,公司也將持續(xù)轉(zhuǎn)型為算法輔助型、深化垂直領域的數(shù)據(jù)服務能力,同時通過人機協(xié)同模式提升數(shù)據(jù)標注的專業(yè)性和準確性。
澳鵬中國研發(fā)負責人、產(chǎn)品和工程副總裁錢程介紹,公司目前80%以上的研發(fā)人員都參與了大模型相關的研發(fā)任務,主要研發(fā)方向包括面向大模型的數(shù)據(jù)服務平臺、面向大模型的數(shù)據(jù)標注工具以及大模型相算法的研發(fā)和應用等。2025年,澳鵬中國將投入研發(fā)資源打造智能化成品數(shù)據(jù)集生產(chǎn)管理平臺,通過自動化的數(shù)據(jù)標注、清洗挖掘和質(zhì)量評估快速構(gòu)建大規(guī)模高質(zhì)量成品數(shù)據(jù)集,為大模型的模型訓練提供高質(zhì)量數(shù)據(jù)養(yǎng)料。
此外,隨著大模型應用向垂直領域的不斷深入,澳鵬中國將結(jié)合自身在大模型和各垂直領域數(shù)據(jù)服務中積累的豐富經(jīng)驗,研發(fā)高精尖垂類數(shù)據(jù)標注平臺,澳鵬中國計劃在2025年上半年推出專業(yè)的大模型醫(yī)療數(shù)據(jù)標注平臺和具身智能數(shù)據(jù)標注平臺,進一步賦能垂直領域客戶構(gòu)建高質(zhì)量模型訓練數(shù)據(jù)。
當前正處于超級周期的啟動階段,大模型發(fā)展迅猛且競爭激烈。許多AI數(shù)據(jù)標注項目具有實驗性質(zhì),澳鵬需要迅速調(diào)整相關的平臺和資源以適應不同的數(shù)據(jù)需求。錢程指出,大模型的發(fā)展,尤其在后訓練階段非常迅速,客戶不斷嘗試新方法以優(yōu)化效果。澳鵬團隊與客戶緊密合作,支持模型訓練的數(shù)據(jù)需求,助力模型能力的不斷提升。
對于嘗試性實驗項目,澳鵬需要迅速構(gòu)建數(shù)據(jù)處理工具和工作流程,采集和標注數(shù)據(jù),并進行結(jié)果訓練和驗證。這需要一個靈活的平臺工作流、自定義標注模板和敏捷的項目管理。澳鵬的大模型智能開發(fā)平臺通過自定義模板引擎,能夠在幾分鐘內(nèi)快速配置數(shù)據(jù)標注模板,而定制化小型工具的開發(fā)則可在幾天到一周內(nèi)完成。
錢程指出,客戶需求快速迭代,創(chuàng)意層出不窮,澳鵬的產(chǎn)品研發(fā)團隊為深度參與在這一快速發(fā)展的賽道而感到興奮。一方面,他們積極跟進國內(nèi)外大模型訓練的技術(shù)變化;另一方面,與客戶實時交流前沿發(fā)展趨勢,共同探討數(shù)據(jù)服務的構(gòu)建方法。
“以AI賦能AI”是澳鵬產(chǎn)品研發(fā)團隊不斷提升數(shù)據(jù)服務效率的宗旨,為了提升團隊的生產(chǎn)力和效率,澳鵬在數(shù)據(jù)處理和生產(chǎn)管理中廣泛應用大模型,替代傳統(tǒng)算法。這不僅大幅提高了技術(shù)和工程團隊的代碼編寫效率,還幫助數(shù)據(jù)交付部門提升了數(shù)據(jù)服務和項目管理的智能化水平。
在大模型時代,盡管之前有不少科技企業(yè)都有自己的數(shù)據(jù)標注工具或平臺,但隨著大模型和生成式AI需求的激增,企業(yè)越來越依賴澳鵬這樣的外部專業(yè)數(shù)據(jù)平臺和服務商,既能滿足不斷變化的工具和平臺開發(fā)需求,又能結(jié)合垂直領域?qū)I(yè)標注人員的RHLF強化學習,一體化滿足大模型和生成式AI的持續(xù)迭代要求。
面向垂直領域的交付能力也是澳鵬的戰(zhàn)略投資方向。繼通用知識后,專業(yè)知識是大模型下一步的重點發(fā)展領域。澳鵬在已有垂直領域能力的基礎上, 2024年開辟了金融、法律、音樂、多語種、文學、TTS、數(shù)學、醫(yī)療、代碼等九個大模型垂直領域團隊,專門負責開發(fā)和培養(yǎng)這些垂直領域的復合型人才,以及承擔相應的數(shù)據(jù)服務項目。
什么是面向垂直領域的復合型人才?簡單理解就是對傳統(tǒng)垂直領域的人才進行培養(yǎng),例如金融、法律、醫(yī)療、音樂等,讓專業(yè)領域人才理解AI與大模型、AI數(shù)據(jù)與AI數(shù)據(jù)項目交付等技術(shù)和項目管理實踐,將專業(yè)領域知識與AI和數(shù)據(jù)項目交付結(jié)合起來,從而更好地服務客戶大模型對于多種垂直領域數(shù)據(jù)的需求。這些專業(yè)人才不僅能夠完成更高質(zhì)量、更專業(yè)的數(shù)據(jù)標注,更能從專業(yè)邏輯上滿足大模型推理的連貫性要求。
澳鵬中國在醫(yī)療AI領域布局近5年,為國內(nèi)最早在醫(yī)療AI領域大規(guī)模投入的公司,擁有500+全職醫(yī)療專業(yè)人員和1000+眾包團隊,覆蓋臨床醫(yī)學、中醫(yī)、中西醫(yī)、護理、藥學、心理、營養(yǎng)學等多個學科,已為國內(nèi)30多個客戶交付500+醫(yī)學項目、超1000萬條數(shù)據(jù)。
自2023年下半年起,澳鵬組建了400+金融背景全職團隊,其中擁有金融、經(jīng)濟或財會學本科及以上學歷占比99%,70%持有基金或證券從業(yè)資格,支持風險管控、數(shù)據(jù)分析等金融應用開發(fā),并具備完善的數(shù)據(jù)安全合規(guī)體系。
2024年,澳鵬在代碼大模型領域取得顯著增長,擁有120+全職技術(shù)人員覆蓋主流編程語言,提供代碼生成、調(diào)試等服務,業(yè)務擴展至能力評估、運維、測試等場景,團隊規(guī)模翻倍,并持續(xù)積累高質(zhì)量代碼數(shù)據(jù)集,確保代碼模型在多種編程場景和任務類型上的泛化能力。
此外,澳鵬在大模型各垂類領域都擁有豐富的專業(yè)人才資源:在法律領域,擁有專業(yè)的法律人才,涵蓋法律檢索、庭審、風控體系建設等核心能力;多語言領域,團隊覆蓋200+語種,具備豐富的多語言項目交付經(jīng)驗;音樂領域,擁有500+兼職音樂專業(yè)人員支持編曲、標注、制譜等任務;TTS領域,擁有數(shù)十個國家TTS采集經(jīng)驗,錄音棚覆蓋全國主要城市;文學領域,團隊成員均具備深刻的文學理解與鑒賞能力,支持跨領域多模態(tài)融合與創(chuàng)新、情感交互與智能推薦系統(tǒng)等領域大模型的發(fā)展……澳鵬憑借強大的專業(yè)團隊和豐富經(jīng)驗,持續(xù)為大模型提供高質(zhì)量數(shù)據(jù)支持。
值得一提的是,在專業(yè)人才招聘方面,澳鵬面向各個垂直領域,不僅有強大的全職招聘團隊,在中國無錫、大連、重慶,在海外菲律賓、越南、印度、馬來、英國、美國等部署高信安基地,還有獨有海內(nèi)外的眾包資源和2000+家供應商合作伙伴渠道,也與數(shù)百家學校展開深入合作,部署垂直領域人才的前置實訓培養(yǎng),從而更好地儲備人才。
數(shù)據(jù)安全和合規(guī)一直是澳鵬的強項,特別是2024年澳鵬中國取得了中國AI數(shù)據(jù)行業(yè)首家ISO 37301合規(guī)管理體系認證,覆蓋AI數(shù)據(jù)采集、數(shù)據(jù)標注和勞動合規(guī)等領域,這是繼澳鵬中國在ISO 27001安全合規(guī)、ISO 27701個人和隱私安全合規(guī)、ISO45001職業(yè)健康安全等進一步夯實和固守合規(guī)底線。澳鵬不斷地強化安全合規(guī)舉措,為所有客戶提供安全、可持續(xù)的數(shù)據(jù)服務,田小鵬博士表示,2024年澳鵬各個基地順利通過了50+多次的客戶“飛檢”和現(xiàn)場審計,為客戶的大模型高數(shù)安要求保駕護航。
澳鵬獲全國數(shù)據(jù)交易聯(lián)盟“年度優(yōu)秀數(shù)據(jù)要素創(chuàng)新企業(yè)獎”
總結(jié)而言:隨著以DeepSeek開源大模型為代表的大模型第二波浪潮剛剛開始,一個真正的技術(shù)、經(jīng)濟和數(shù)據(jù)的超級周期才正式啟動。在大模型第一波浪潮中,啟動的主要是AI和科技公司;而在大模型第二波浪潮中,啟動的將是所有行業(yè)領域的公司和政府機構(gòu),并將從中國聚焦到全球拓展,形成了從技術(shù)進步到生產(chǎn)力提升再到營收增長以及更多技術(shù)投資的正向循環(huán)。
在超級周期的正向循環(huán)中,數(shù)據(jù)真正成為了經(jīng)濟增長的“燃料”,一個AI數(shù)據(jù)服務的多年期藍海正在形成。田小鵬博士表示,“到2030年,澳鵬中國制定了非常遠大的營收目標——20+億人民幣,更重要的是澳鵬中國將不遺余力地成就我們中國AI客戶,通過持續(xù)創(chuàng)新讓中國的AI的產(chǎn)品和服務能領先于世界!”
免責聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點,亦不代表本網(wǎng)站贊同其觀點或證實其內(nèi)容的真實性。如稿件版權(quán)單位或個人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。
互聯(lián)網(wǎng)新聞信息服務許可證10120230012 信息網(wǎng)絡傳播視聽節(jié)目許可證0121673 增值電信業(yè)務經(jīng)營許可證京B2-20171219 廣播電視節(jié)目制作經(jīng)營許可證(京)字第10250號
關于我們 中宏網(wǎng)動態(tài) 廣告服務 中宏網(wǎng)版權(quán)所有 京ICP備2023030128號-1 舉報電話:010-63359623
Copyright ? 2016-2025 by netresults-search.com. all rights reserved 運營管理:國家發(fā)展和改革委員會宏觀經(jīng)濟雜志社