在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用NVIDIA NeMo生成高質量的語音識別標簽

星星科技指導員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-27 09:15 ? 次閱讀

使用 NVIDIA NeMo 和 標簽工作室 中的自動語音識別( ASR )模型處理音頻數據時,可以節省時間并產生更準確的結果。

NVIDIA NeMo 提供了可重用的神經模塊,使得創建新的神經網絡架構變得容易,包括 ASR 的預構建模塊和現成模型。借助 NVIDIA NeMo 的強大功能,您可以從預訓練語音識別模型中獲得音頻轉錄。添加 labelstudio 及其開源數據標記功能,您可以進一步提高轉錄質量。

解決方案

poYBAGJomUSASBfSAAAy2POsRYU582.jpg

圖 1 使用 Label Studio 和 NeMo 注釋和更正轉錄本的 ASR 工作流。

按照本文中的步驟使用 Label Studio 設置 NVIDIA NeMo ASR ,以生成高質量的音頻轉錄本。

連接 NVIDIA NeMo 模型,在 Label Studio 中自動轉錄音頻文件。

設置音頻轉錄項目。

從 Label Studio 驗證和導出修訂的音頻轉錄本。

微調 NeMo ASR 模型與修改后的音頻轉錄從標簽工作室。

先決條件

開始之前,請確保您擁有以下資源:

音頻數據文件。 此音頻 MIG 可以是客戶服務電話、電話訂單、銷售對話的錄音,也可以是其他與人交談的錄音。音頻文件必須采用以下文件格式之一:

WAV

AIFF

MP3

AU

FLAC

已安裝 Label Studio 。 在本地計算機或云服務器上使用首選方法安裝 Label Studio 。有關更多信息,請參閱 Label Studio 文檔中的 Quickstart 。

NeMo 工具箱已安裝

免費音頻數據

如果您沒有任何音頻數據,可以使用示例數據集或歷史音頻數據集:

LJ 語音數據集 是非小說類書籍段落的公共域數據集。

Librispeech 還提供了一個 基于開放 SLR 的開源 ASR 語料庫 。

您可以使用許多其他 ASR 數據集。有關詳細信息,請參閱 數據集 – 簡介 。您還可以使用國會圖書館網站上的公共域錄音集,如 美國棒球運動員訪談錄 。

確定要轉錄的音頻后,就可以開始處理它了。

安裝 Label Studio ML 后端

安裝 Label Studio 后,請安裝 Label Studio 機器學習后端。從命令行運行以下命令:

git clone https://github.com/heartexlabs/label-studio-ml-backend 

設置環境:

cd label-studio-ml-backend

# Install label-studio-ml and its dependencies
pip install -U -e .

# Install the nemo example dependencies
pip install -r label_studio_ml/examples/requirements.txt

連接 NVIDIA NeMo 模型,在 Label Studio 中自動轉錄音頻文件

要使用預先訓練的 ASR 模型的預測對數據進行預標記,請在 Label Studio 中將 NeMo 工具箱設置為機器學習后端。 Label Studio 機器學習后端允許您使用預先訓練的模型來預標記數據。

Label Studio 包括使用 利用 NGC 云中的 NeMo 開發的預訓練 QuartzNet15x5 模型 的 一個例子 ,但是如果另一個模型更適合,您可以用您的數據設置一個不同的模型。有關更多信息,請參閱 NeMo 提供的 ASR 型號列表 。

在命令行中,將 NeMo 設置為機器學習后端,并使用該模型啟動一個新的 Label Studio 項目。

安裝 NeMo 工具箱 在 Docker 容器中或使用 pip 。

下載 NeMo ASR 模型。提供的 Label Studio 示例腳本從 NGC 云下載預先訓練的 QuartzNet 模型。要使用不同的模型,請從 NGC 下載該模型。

從命令行啟動 Label Studio 機器學習后端。

label-studio-ml init my_model --from label_studio_ml/examples/nemo/asr.py

啟動機器學習后端。默認情況下,模型在本地主機上以端口 9090 啟動。

label-studio-ml start my_model

用模型啟動 Label Studio 。

label-studio start my_project --ml-backends http://localhost:9090

設置音頻轉錄項目

啟動 Label Studio 后,導入音頻數據并設置正確的模板來配置標簽。 VZX19 是自動語音識別的最佳選擇,它使音頻數據的注釋變得容易。

打開 Label Studio ,導入數據,然后選擇模板。

選擇 Import 并以純文本或 JSON 文件的形式導入音頻數據,這些文件引用在線存儲(如 Amazon S3 )中托管的音頻文件的有效 url 。

2 從 Tasks 列表中,選擇 Settings 。

3 在 標簽界面 選項卡上,瀏覽模板并選擇 自動語音識別 模板。

4 選擇 Save 。

驗證并輸出模型預測

作為注釋器,檢查任務界面上音頻數據的任務并驗證。如有必要,糾正 NeMo 語音模型預測的轉錄本。

從 Label Studio 中的任務列表中,選擇 Label 。

對于每個音頻樣本,聆聽音頻并回顧 NeMo 模型產生的轉錄,作為預標記過程的一部分。

如果成績單中有任何單詞不正確,請更新。

保存對成績單的更改。選擇 Submit 提交成績單并查看下一個音頻樣本。

接下來,按照 NVIDIA NVIDIA 文檔中的 NeMo ASR 集合 所述,以 NeMo 模型所期望的正確格式從 Label Studio 導出完成的音頻轉錄本。

要導出完成的音頻,請執行以下操作:

從 Label Studio 中的任務列表中,選擇 Export 。

選擇名為 ASR_MANIFEST 的音頻轉錄 JSON 格式。

有關 Label Studio 中可用導出格式的詳細信息,請參閱 從 Label Studio 導出結果 。

使用高質量的成績單來微調您的 ML 模型

當您處理完音頻并調整完轉錄的文本后,剩下的是音頻轉錄本,您可以用來重新培訓 NeMo 中包含的 ASR 模型。 Label Studio 生成與 NeMo 培訓完全兼容的注釋。

要更新 QuartzNet 模型檢查點,您可以在幾行代碼中完成,從頭開始訓練模型,或者使用 PyTorch Lightning 。例子也可以在 NeMo Jupyter 筆記本中找到。

通過同時使用 Label Studio 和 NeMo ,您可以節省從頭開始處理每個音頻文件的時間 NeMo 可以立即為您提供高度準確的預測,而 Label Studio 可以幫助您實現完美的預測 今天就試試 !

關于作者

Nikolai Liubimov是Heartex的CTO。 完成博士學位后 他在CS擔任機器學習研究員,后來進入該行業,并花了10年的時間將深度學習技術應用于現實世界中的問題。 這項經驗為當前缺少哪些工具提供了寶貴的見解,從而創建了一家初創公司來幫助數據科學和機器學習工程團隊構建和改進其ML模型。

Sarah Moir是Heartex的產品內容和教育主管,為Heartex的數據注釋和標簽解決方案撰寫文檔,博客文章和教育教程。 薩拉(Sarah)在過去的八年中一直是數據和安全領域的技術作家,并且對數據分析,機器學習和編寫充滿熱情。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5038

    瀏覽量

    103309
  • 計算機
    +關注

    關注

    19

    文章

    7521

    瀏覽量

    88278
  • 服務器
    +關注

    關注

    12

    文章

    9240

    瀏覽量

    85702
收藏 人收藏

    評論

    相關推薦

    借助谷歌Gemini和Imagen模型生成高質量圖像

    在快速發展的生成式 AI 領域,結合不同模型的優勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細且富有創意的提示,然后使用 Imagen 3 模型根據這些提示生成高質量的圖像,您可
    的頭像 發表于 01-03 10:38 ?361次閱讀
    借助谷歌Gemini和Imagen模型<b class='flag-5'>生成</b><b class='flag-5'>高質量</b>圖像

    立洋光電助力城市照明高質量發展

    為促進湖南省照明行業向高端化、智能化、綠色化產業升級,湖南省城鄉建設行業協會照明分會在長沙隆重舉行了2023年湖南省照明行業年會暨“創新驅動、以新質生產力賦能城市照明高質量發展”技術交流活動。
    的頭像 發表于 10-22 10:49 ?348次閱讀

    中興通訊引領5G-A高質量發展新紀元

    中國5G商用5周年之際,以“智聯未來 無限可能”為主題的2024移動通信高質量發展論壇在北京舉辦。本屆論壇系統呈現總結我國移動通信,特別是5G產業自身高質量發展和引領數字經濟高質量發展的成果和經驗,展望5G-A、6G協同創新發展
    的頭像 發表于 10-15 10:32 ?529次閱讀

    揭秘高質量點焊機的五大標準:打造焊接性能的基石

    在現代工業生產領域,點焊機的重要性不言而喻。高質量的點焊機如同一位技藝精湛的工匠,確保了不同材料間的牢固連接,其出色的焊接性能、穩定的工作狀態和用戶友好的操作界面,已經獲得了業界的高度評價。那么
    的頭像 發表于 09-12 15:26 ?529次閱讀
    揭秘<b class='flag-5'>高質量</b>點焊機的五大標準:打造焊接性能的基石

    NVIDIA Nemotron-4 340B模型幫助開發者生成合成訓練數據

    Nemotron-4 340B 是針對 NVIDIA NeMoNVIDIA TensorRT-LLM 優化的模型系列,該系列包含最先進的指導和獎勵模型,以及一個用于生成式 AI
    的頭像 發表于 09-06 14:59 ?349次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B模型幫助開發者<b class='flag-5'>生成</b>合成訓練數據

    NVIDIA Broadcast助力實現高質量直播和遠程工作

    AI 為計算領域帶來了深遠的改變。雖然最近的焦點是生成式 AI,但多年來,由 NVIDIA RTX 提供支持的 AI 加速工具也在改善游戲、內容創作和工作效率方面起到了關鍵作用。
    的頭像 發表于 08-23 15:35 ?615次閱讀

    科技創新!國產自主三坐標測量機推動產業高質量發展

    科技創新推動高質量發展,精密幾何測量儀器是核心。中圖三坐標測量機采用創新技術,提升測量精度和穩定性,擁有自主可控軟件,助力產業升級,實現高質量發展。
    的頭像 發表于 07-12 11:32 ?1304次閱讀
    科技創新!國產自主三坐標測量機推動產業<b class='flag-5'>高質量</b>發展

    Transformer模型在語音識別語音生成中的應用優勢

    隨著人工智能技術的飛速發展,語音識別語音生成作為人機交互的重要組成部分,正逐漸滲透到我們生活的各個方面。而Transformer模型,自其誕生以來,憑借其獨特的自注意力機制和并行計算
    的頭像 發表于 07-03 18:24 ?1206次閱讀

    維信諾高質量發展創新大會暨全球合作伙伴大會召開

    4月18日,維信諾高質量發展創新大會暨全球合作伙伴大會在合肥舉行。大會以“聚智同行,質勝未來”為主題,合肥市相關領導、專家學者及數百家維信諾核心供應伙伴齊聚一堂,共謀新興顯示產業高質量發展之路。
    的頭像 發表于 04-19 09:26 ?564次閱讀

    北斗芯片產業的高質量發展之路

    高質量發展是全面建設社會主義現代化國家的首要任務”,二十大報告中對高質量發展有著明確的論斷和要求。在2023年的全國兩會中還指出,加快實現高水平科技自立自強,是推動高質量發展的必由之路。中國衛星
    的頭像 發表于 03-15 14:03 ?412次閱讀
    北斗芯片產業的<b class='flag-5'>高質量</b>發展之路

    兩會熱議高質量發展 華大北斗芯領航

    3月5日,第十四屆全國人民代表大會第二次會議在北京正式開幕。在今年的政府工作報告中,高質量發展、新質生產力、科技創新、高水平科技自立自強等關鍵詞頻頻出現。 當前,高質量發展已成為經濟社會發展的主旋律
    的頭像 發表于 03-12 09:10 ?1628次閱讀
    兩會熱議<b class='flag-5'>高質量</b>發展 華大北斗<b class='flag-5'>用</b>芯領航

    富捷電子被授予“高質量發展突出貢獻獎”

    在近日舉行的馬鞍山新區高質量發展表彰大會上,富捷電子在推動地區經濟發展中的卓越貢獻,被授予“高質量發展突出貢獻獎”。
    的頭像 發表于 02-23 15:16 ?694次閱讀

    穩中創新?產業升級?高質量發展 | 聯誠發高質量發展工作推進會議召開

    2月21日下午,聯誠發LCF以“穩中創新?產業升級?高質量發展”為主題的企業高質量發展工作推進大會在聯誠發深圳總部隆重召開。擂起奮進催征的戰鼓,爭分奪秒搶抓寶貴春光,明確企業重點目標任務,全力以赴
    的頭像 發表于 02-22 11:33 ?483次閱讀
    穩中創新?產業升級?<b class='flag-5'>高質量</b>發展 | 聯誠發<b class='flag-5'>高質量</b>發展工作推進會議召開

    捷易科技出席廣東省韶關市高質量發展大會

    ABSTRACT摘要2月19日,2024年韶關市高質量發展招商大會在韶關舉行,來自政府、科技、企業各界專家代表共同探討韶關高質量發展。捷易科技總經理韓運恒出席大會。JAEALOT2024年2月19日
    的頭像 發表于 02-22 08:25 ?507次閱讀
    捷易科技出席廣東省韶關市<b class='flag-5'>高質量</b>發展大會

    語音數據集:智能駕駛中車內語音識別技術的基石

    的發展趨勢。 二、語音數據集在智能駕駛中的應用 訓練與優化:高質量語音數據集是訓練和優化語音識別模型的基礎。通過大量的
    的頭像 發表于 01-31 16:07 ?570次閱讀
    主站蜘蛛池模板: 国产精品你懂的| 天天se天天cao综合网蜜芽| 特极毛片| 亚洲啪啪免费视频| 天天鲁天天爽天天视频| 午夜看片在线观看| 欧美成人 一区二区三区| 欧美色图色就是色| 特黄特色三级在线观看| 色五夜婷婷| 天天做人人爱夜夜爽2020毛片| 性欧美视频videos6一9| 国产成人综合日韩精品婷婷九月| 免费在线播放视频| 极品丰满翘臀后进啪啪| 天堂资源在线最新版| 久久久这里有精品999| 欧美同性精品xxxx| 久久精品在| 特级黄毛片| 伦理片日本韩国电影三级在线观看| 三级毛片在线播放| 特级淫片aaaaa片毛片| 色黄网站成年女人色毛片 | 久久看免费视频| 美女视频黄视大全视频免费网址| 精品三级网站| 国模私拍福利一区二区| 久久精品.com| 中文字幕自拍| 99视频在线永久免费观看| 丁香狠狠| 日日干夜夜操| 久久精品久久久| 黄色成人一级片| 91免费视频网站| 天天做人人爱夜夜爽2020 | 粗又长好猛好爽| 日韩色天使综合色视频| 欧美影院一区二区| www四虎影视|