媲美真人配音!微軟語音合成助手 - 免費文字轉換音頻的 TTS 工具 (發音更有感情)

AI 技術在飛速發展,比如美顏換臉、文字識別語音識別移除圖片背景、自動駕駛等等都在生活的各個方面起到了應用。而「語音合成 TTS」方面,如今實用性也已非常驚人了。

騰訊雲阿里雲、百度雲等都推出文字轉語音在線服務 API,但合成的人聲大多時候都很容易聽出「機械人味」。而微軟Azure TTS 文本轉語音服務效果就比較讓人驚嘆了!它擁有多種聲音和情感風格,能像真人一樣朗讀出抑揚頓挫,使得合成的人聲非常逼真自然,不妨來看看……

微軟自然語音轉換 - 像真人般將文本朗讀出來並保存成音頻

微軟文本轉語音Azure Text to Speech 是一個能將文字轉換成真人般自然朗讀的雲服務,相比同類 TTS 強大之處在於,它藉助 AI 神經網絡技術,讓合成的語音擁有媲美真人的表現力,實現人聲語調與情感匹配,朗讀時能表現出高興、悲傷、新聞廣播、客服、恐懼、耳語等情感。

微軟語音合成助手 Azure TTS

加上語速、語調、發音、停頓都可以由用戶調節,實際生成的語音非常自然逼真!完全不再像機械人了!因此微軟文本轉語音技術幾乎能應用在任何場景。新版的 Edge 瀏覽器的朗讀功能就是基於此技術而來。可惜此服務是付費的,你還懂編程才能用上它,這似乎離普通用戶很遠?

別急!其實,微軟提供了一個免費的在線 DEMO 演示,可以讓用戶隨便輸入文字實現在線試聽 (但字數有限制,且試聽無法保存)。於是,高手們紛紛各顯神通,給我們帶來了幾款如微軟語音合成助手Edge-TTS-record微軟 TTS 下載按鈕腳本插件等免費工具,可以幫助你將一大段文字轉換成音頻導出 mp3 或錄製成 wav 保存下來,用於其他地方。

微軟 TTS 朗讀效果預覽:

我們先來聽幾段微軟文本轉語音的效果吧,相信你一定能聽出來,它真的比目前大多數 TTS 同行要優秀很多,情感表現力簡直滿分!開心、嚴肅不同場景可以用不同的調調,就連講個鬼故事也都能講出害怕的感覺。

其實如今在嗶哩嗶哩、抖音、快手裡好多視頻的配音,都有使用了這個微軟語音庫來生成,人的聲音聽起來很自然,不特意地去留意,基本都分辨不出來是用機器合成的。

微軟語音合成助手免費版 (Windows)

微軟語音合成助手」是一款完全免費的文字轉語音的 Windows 電腦版軟件,它綠色免安裝,而且體積小巧,打開就能使用 (需聯網),軟件界面非常簡潔,上手即會使用。

微軟語音合成助手 Azure TTS

它完全藉助了微軟的 Azure TTS 服務來將文字合成並生成語音,支持在線試聽,也可以保存成 mp3 音頻文件,效果非常接近真人朗讀!不僅真實自然,而且也能設置它的情感風格、語速、停頓、音量等等。

微軟語音合成助手可以支持導入 TXT、SRT 字幕、PDF 多種格式的文檔文件,甚至還能支持 JPG、PNG 截圖裡的文字識別並導入成文本內容。並且重點是,此軟件使用了分段下載合併的方式解決了一次只能轉換 2500 個字數限制的問題。

軟件支持保存導出編輯內容,支持翻譯,自動排版,自動標點,文本替換,敏感詞提醒,敏感詞替換,SSML 多人語音混編等多種功能,還可以實現批量轉換。

瀏覽器插件:微軟 TTS 下載音頻按鈕(油猴腳本)

前面說到,微軟 TTS 本身提供了文字轉語音的在線演示的網頁版,可以讓用戶在瀏覽器上輸入或粘貼文本,轉換成語音進行試聽,但官網上並不提供下載功能。因此,有開發者製作了這麼一個「微軟 TTS 下載音頻按鈕」插件,可以讓你將試聽的語音下載保存成 MP3 音頻。

微軟 TTS 語音下載按鈕插件

這款瀏覽器插件是完全免費的,它是以 UserScript (油猴腳本) 的形式提供的,比如 ChromeEdge 等瀏覽器安裝了 Tempermonkey 插件后就能安裝此類腳本。安裝成功並啟用的話,微軟 TTS 的網頁上除了試聽按鈕以外,還會如上圖一樣,增加一個「下載音頻」的按鈕。

所以,如果你使用 MacLinux 或者不希望下載第三方軟件,那麼使用此腳本也可以在瀏覽器里搞定文本轉音頻。

Edge-TTS-record 開源錄製工具

這款開源免費的「edge-TTS-record」工具,是一款可以錄製 Microsoft Edge 瀏覽器的語音合成(TTS)語音並輸出為 .wav 音頻的 Windows 版工具。另外,網上也有一款名為「Read Aloud by asup」的工具與此程序幾乎一樣,暫不知道是否同一作者。

Edge TTS record 微軟語音錄製工具

由於 Edge 瀏覽器也是使用了微軟 Azure TTS 的技術,因此它擁有了同樣的逼真自然的聲音引擎,包括了曉曉、雲楊等人物聲音。不過相比前兩者,此工具的實現方法是需要將試聽的聲音進行「錄音」而來的,因此錄製時間較長,同時過程中也可能受到系統其他軟件聲音的影響。

aspeak - 命令行文字轉語音工具:

對於有特殊需求的朋友,還有一款命令行版的微軟 TTS 語音合成工具 aspeak,這是用 Python 編寫的基於 Azure 語音合成的命令行程序,安裝簡單,還可以跨平台使用。

#安裝 aspeak pip install --upgrade aspeak  # 最簡單的例子: aspeak -t "異次元軟件世界,你好呀!" -l zh-CN  #導入 .txt 文件,並轉換成 .wav 音頻保存 aspeak -f input.txt -l zh-CN -o ouput.wav

更多具體的參數,比如怎樣指定語音,大家可以看 aspeak 的官方文檔。至於此工具的的實際應用例子嘛,就得看大家發揮想象力和二次開發的能力了。

總結:

不管你是視頻 UP 主、自媒體還是辦公人士,藉助微軟 Azure TTS 的語音合成引擎來不僅能錄製一些旁白、朗讀稿子電子書、給視頻配音等,也能自娛自樂,給生活和工作都帶來方便與樂趣。

上面的幾款工具都是免費的,感興趣和有需要的朋友都可以下載使用。當然了,微軟這個 TTS 雲服務接口本來是需要付費的,而這些免費工具都是基於微軟的免費 Demo 演示開發而來,哪一天要是被關掉了,可能就無法使用了。所以,免費有限,大家且用且珍惜吧……

相關文件下載地址

官方網站:訪問
軟件性質:免費/開源
相關鏈接:人工智能相關  |  微軟相關  |  視頻相關  |  素材相關  |  語音相關
解壓密碼:www.iplaysoft.com

下載微軟語音合成助手 (Win)  |  Edge-TTS-record (Win)  |  微軟 TTS 下載按鈕 (瀏覽器腳本)


想在手機閱讀更多中國內地資訊資訊?下載【香港矽谷】Android應用
分享到Facebook
技術平台: Nasthon Systems