99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

重磅!OpenAI推出語音智能體全家桶:可以實現前所未有的精細化教AI說話

0
分享至


就在剛剛,OpenAI 發布了一系列新模型和工具,具體來說OpenAI在API 中推出三種新的先進音頻模型:

? 兩種語音轉文本模型 - 表現優于 Whisper
新的 TTS (文本轉語音)模型——你可以教AI如何說話


核心只有一個:讓開發者輕松構建強大的「語音智能體」!

在直播中,據OpenAI 平臺負責人 Olivier Godement 說他們一直在積極構建 AI 智能體,而現在,他們要將重點從文本拓展到語音

為什么是語音? Olivier 認為,語音是人類最自然的交互方式,相較于讀寫,語音溝通更加便捷和人性化。 因此,打造可靠、精準、靈活的語音智能體,將極大地拓展 AI 的應用場景

第一時間給大家劃個重點

三大模型齊發力,打造「聲控AI」基石

為了實現這一愿景,OpenAI 祭出了三大法寶:

1.兩款全新「語音轉文本」模型:GPT-4o-transcribe 和 GPT-4o-mini-transcribe

這兩款模型號稱“地表最強”,性能全面超越之前的 Whisper 模型,并且在各種語言的轉錄準確率上都實現了質的飛躍。這意味著,AI 聽得更清、更準了!

2.全新「文本轉語音」模型:GPT-4o-mini-tts

這款模型首次讓開發者可以精細控制 AI 的發聲方式,不僅能決定 AI 說什么,更能控制 AI 怎么說!語調、情感,都能由你掌控,打造更富有人性的聲音體驗

為了讓大家更容易得使用這個模型,OpenAI為這個模型建了新的網站,http://OpenAI.fm,一個供開發人員嘗試 OpenAI API 中的新文本轉語音模型的交互式演示,OpenAI已經預先生成了各種演示文本,可以選擇不同的聲音,不同的情緒來表達你的文本,你也可以自己輸入文本,體驗選擇不同聲音和情緒來表達

3.升級版 Agent SDK

為了讓開發者更便捷地構建語音智能體,OpenAI 對之前發布的 Agent SDK 進行了重大更新,讓文本智能體“一鍵升級”為語音智能體成為可能!這次升級亮點頗多:

語音能力加持:Agent SDK 深度整合了 OpenAI 最新的「語音轉文本」和「文本轉語音」模型,開發者無需復雜配置,即可為智能體賦予“耳朵”和“嘴巴”。

流式處理優化:升級后的 SDK 支持雙向流式傳輸,音頻輸入和語音輸出都更加實時,大幅提升了語音交互的流暢性。

開箱即用,快速上手:Agent SDK 提供了豐富的示例代碼和詳盡的文檔,即使是新手開發者也能快速上手,將文本智能體輕松轉化為語音智能體

調試利器:Agent SDK 與 OpenAI 調試 UI 無縫集成,開發者可以直觀地追蹤語音交互全過程,分析音頻輸入、文本轉錄、模型推理、語音合成等各個環節,Debug 效率直線提升!


構建語音智能體,兩種主流方案

OpenAI 的專家 Jeff Harris 在直播中分享了構建語音智能體的兩種主要方法:

方法一:實時 API 直連「語音-語音」模型

這種方式更加前沿,直接使用「語音-語音」模型,讓 AI 直接理解音頻并輸出語音,速度更快,體驗更流暢。 這也是 ChatGPT 高級語音模式背后的技術


方法二:鏈式調用音頻模型與文本模型


這是一種更易上手、更可靠的方案,也是 OpenAI 此次重點推薦的方式。 它通過以下步驟實現:

  1. 1.語音轉文本模型 (Speech-to-Text):將用戶語音轉化為文本。

  2. 2.文本大模型 (Text-based LLM):例如 GPT-4o,理解文本并生成合適的回復。

  3. 3.文本轉語音模型 (Text-to-Speech):將文本回復轉化為自然流暢的語音。

Jeff 強調,鏈式方案的優勢在于:

  • ?模塊化:各個環節的模型可以靈活替換,選擇最適合的組件。

  • ?高可靠性:文本模型的智能程度依然是目前的“黃金標準”,鏈式方案能保證更高的可靠性。

  • ?易上手:開發者可以基于已有的文本智能體項目,快速添加語音功能

模型背后的技術

使用真實音頻數據集進行預訓練

新音頻模型基于 GPT?4o 和 GPT?4o-mini 架構,并在專門的以音頻為中心的數據集上進行了廣泛的預訓練,這對于優化模型性能至關重要。這種有針對性的方法可以更深入地洞察語音細微差別,并在與音頻相關的任務中實現出色的性能

先進的蒸餾方法

增強蒸餾技術,使知識從最大的音頻模型轉移到更小、更高效的模型。利用先進的自我對弈方法,我們的蒸餾數據集有效地捕捉了真實的對話動態,復制了真正的用戶-助手互動。這有助于小型模型提供出色的對話質量和響應能力

強化學習范式

對于語音轉文本模型,集成了強化學習 (RL-heavy) 重度范式,將轉錄準確度推向了最先進的水平。這種方法大大提高了準確度并減少了幻覺,使語音轉文本解決方案在復雜的語音識別場景中具有極強的競爭力

性能炸裂,價格親民

GPT-4o 系列「語音轉文本」模型的驚人性能:在 FLEURS 基準測試中,錯誤率遠低于上一代 Whisper 模型,真正做到了“更上一層樓”



更令人驚喜的是,價格方面也十分良心:

  • ?GPT-4o-transcribe:每分鐘 0.6 美分,與 Whisper 模型價格一致

  • ?GPT-4o-mini-transcribe:每分鐘僅需 0.3 美分,性價比更高!

  • ?GPT-4o-mini-tts:文本轉語音模型,每分鐘 1 美分,經濟實惠

參考:

https://openai.com/index/introducing-our-next-generation-audio-models/

https://www.youtube.com/watch?v=lXb0L16ISAc

?星標AI寒武紀,好內容不錯過?

用你的在看告訴我~

求贊

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
巴西隊夢想即將成真!大羅卡卡有功:談判2年終于請來安帥

巴西隊夢想即將成真!大羅卡卡有功:談判2年終于請來安帥

葉青足球世界
2025-04-29 09:08:06
震驚!華人男子駕車沖撞慶典致11死:父母兄弟先后離世,心理崩潰

震驚!華人男子駕車沖撞慶典致11死:父母兄弟先后離世,心理崩潰

華人生活網
2025-04-29 03:32:07
校園“奶頭樂”現象盛行,不少學生深陷其中,家長卻渾然不知……

校園“奶頭樂”現象盛行,不少學生深陷其中,家長卻渾然不知……

大道微言
2025-04-11 06:47:45
缺少經驗?西媒:巴薩可登場的球員只有德容參加過歐冠半決賽

缺少經驗?西媒:巴薩可登場的球員只有德容參加過歐冠半決賽

雷速體育
2025-04-29 15:13:14
60分血案!4-0!季后賽歷史崩了啊!

60分血案!4-0!季后賽歷史崩了啊!

柚子說球
2025-04-29 11:43:50
新型擦邊來襲,小碼瑜伽褲“裸感”設計秀身材,這到底是運動還是賣弄?

新型擦邊來襲,小碼瑜伽褲“裸感”設計秀身材,這到底是運動還是賣弄?

半糖甜而不膩
2025-04-17 12:13:28
五一將至,帶孩子去這4個地方走走,長大后想沒出息都難!

五一將至,帶孩子去這4個地方走走,長大后想沒出息都難!

浩源的媽媽
2025-04-28 05:20:07
不買波音就關發動機?美國拿C919航發“敲竹杠”,我國亮出底牌

不買波音就關發動機?美國拿C919航發“敲竹杠”,我國亮出底牌

火星方陣
2025-04-29 11:46:22
定了!廣州市自來水新價格6月1日起實施

定了!廣州市自來水新價格6月1日起實施

南方都市報
2025-04-29 14:34:12
諾貝爾獎得主重大發現:決定人壽命長短的并不是吃和運動,而是…

諾貝爾獎得主重大發現:決定人壽命長短的并不是吃和運動,而是…

譚老師地理工作室
2025-03-09 07:41:58
西媒:家人曾擔心到巴西執教不安全,安帥為了世界杯最終選擇桑巴軍團

西媒:家人曾擔心到巴西執教不安全,安帥為了世界杯最終選擇桑巴軍團

雷速體育
2025-04-29 08:28:11
董小姐的瓜越扒越大,跟她魔幻晉升之路相比,男女私情算不了什么

董小姐的瓜越扒越大,跟她魔幻晉升之路相比,男女私情算不了什么

大歪歪
2025-04-29 15:25:31
中國香港果斷出手,下令嚴查小馬科斯家族,杜特爾特等來翻身機會

中國香港果斷出手,下令嚴查小馬科斯家族,杜特爾特等來翻身機會

博覽歷史
2025-04-29 14:06:16
國家發改委:指導限購城市針對長期搖號家庭、無車家庭,定向增發購車指標

國家發改委:指導限購城市針對長期搖號家庭、無車家庭,定向增發購車指標

平谷微推廣
2025-04-28 23:46:21
潛伏我國30年美國辣醬巨頭,年賺300億打敗老干媽,被誤認是國貨

潛伏我國30年美國辣醬巨頭,年賺300億打敗老干媽,被誤認是國貨

素衣讀史
2024-12-19 14:16:46
阿梓不可愛

阿梓不可愛

喜歡歷史的阿繁
2025-04-28 14:09:49
德國足協回應呂迪格事件:我們已和他本人聯系,他被皇馬過度渲染的緊張氛圍影響

德國足協回應呂迪格事件:我們已和他本人聯系,他被皇馬過度渲染的緊張氛圍影響

雷速體育
2025-04-28 18:54:20
科爾:如果是常規賽巴特勒可能還需要休息一兩周,但現在是季后賽

科爾:如果是常規賽巴特勒可能還需要休息一兩周,但現在是季后賽

雷速體育
2025-04-29 13:37:09
安踏主播相宜被封號!網友:她只是說句,大家都這么想的話而已…

安踏主播相宜被封號!網友:她只是說句,大家都這么想的話而已…

火山詩話
2025-04-28 07:37:24
火箭106-109負勇士:數據揭示關鍵敗因

火箭106-109負勇士:數據揭示關鍵敗因

格斗聯盟
2025-04-29 15:55:14
2025-04-29 16:40:49
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領域
653文章數 259關注度
往期回顧 全部

科技要聞

Qwen3登頂開源榜 阿里稱大模型是十年長跑

頭條要聞

印巴再度交火 外交部回應是否計劃"介入調解"

頭條要聞

印巴再度交火 外交部回應是否計劃"介入調解"

體育要聞

勇士火箭雷霆太陽,你們是怎么失去他的?

娛樂要聞

甜馨簽樂華出道惹爭議 維護爸媽被質疑

財經要聞

特朗普執政百日下的美元危機

汽車要聞

年輕or傳統?上汽奧迪A5L與一汽奧迪A5L有什么不同?

態度原創

數碼
本地
手機
房產
公開課

數碼要聞

最新泄露信息顯示索尼WH-1000XM6降噪耳機距離發布又近了一步

本地新聞

春色滿城關不住 | 北洋門扉開:名校與花潮撞個滿懷

手機要聞

小屏黨春天 OPPO Find X8s學生購機優惠多多

房產要聞

1.6w+起!國興核心驚現改善神盤,海口房價徹底殺瘋!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 嘉黎县| 大荔县| 定边县| 米易县| 师宗县| 扎鲁特旗| 藁城市| 兴宁市| 漠河县| 时尚| 田林县| 区。| 小金县| 贵德县| 宁德市| 沐川县| 滦南县| 海南省| 皮山县| 呼伦贝尔市| 武汉市| 日土县| 威宁| 林口县| 沈阳市| 宜宾县| 桃园县| 五峰| 杨浦区| 兰考县| 澄迈县| 利津县| 醴陵市| 株洲市| 铜山县| 绍兴市| 平潭县| 霍邱县| 江阴市| 湟中县| 景东|