<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>多语言 on Text Matrix</title><link>https://txtmix.com/tags/%E5%A4%9A%E8%AF%AD%E8%A8%80/</link><description>Recent content in 多语言 on Text Matrix</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 23 May 2026 08:20:36 +0800</lastBuildDate><atom:link href="https://txtmix.com/tags/%E5%A4%9A%E8%AF%AD%E8%A8%80/index.xml" rel="self" type="application/rss+xml"/><item><title>Supertonic 3: 99M参数本地多语言TTS引擎，完全基于ONNX实现端侧推理</title><link>https://txtmix.com/posts/tech/supertonic-onnx-tts-engine-guide/</link><pubDate>Mon, 18 May 2026 20:00:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/supertonic-onnx-tts-engine-guide/</guid><description>&lt;h1 id="supertonic-3-99m参数本地多语言tts引擎完全基于onnx实现端侧推理">Supertonic 3: 99M参数本地多语言TTS引擎，完全基于ONNX实现端侧推理&lt;/h1>
&lt;h2 id="核心价值纯端侧隐私优先">核心价值：纯端侧、隐私优先&lt;/h2>
&lt;p>Supertonic 3 是 Supertone 公司开源的&lt;strong>超高速本地多语言 TTS 引擎&lt;/strong>，99M 参数，ONNX 格式，完全离线运行。与云端 TTS 服务相比，核心差异在于：&lt;/p></description></item><item><title>VoxCPM2：Tokenizer-Free TTS 多语言语音合成指南</title><link>https://txtmix.com/posts/tech/voxcpm2-tokenizer-free-tts-guide/</link><pubDate>Sun, 12 Apr 2026 11:50:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/voxcpm2-tokenizer-free-tts-guide/</guid><description>&lt;h1 id="voxcpm2tokenizer-free-tts-多语言语音合成指南-">VoxCPM2：Tokenizer-Free TTS 多语言语音合成指南 ⭐⭐⭐&lt;/h1>
&lt;blockquote>
&lt;p>&lt;strong>目标读者&lt;/strong>：AI语音开发者、研究人员，对TTS系统有一定了解
&lt;strong>核心问题&lt;/strong>：如何实现高质量、多语言、可控的语音合成？&lt;/p>&lt;/blockquote>
&lt;hr>
&lt;h2 id="1-学习目标">§1 学习目标&lt;/h2>
&lt;p>完成本文档后，你将掌握：&lt;/p></description></item><item><title>OpenAI Whisper：97.2k Stars 通用语音识别完全指南</title><link>https://txtmix.com/posts/tech/openai-whisper-speech-recognition-guide/</link><pubDate>Mon, 06 Apr 2026 22:50:00 +0800</pubDate><guid>https://txtmix.com/posts/tech/openai-whisper-speech-recognition-guide/</guid><description>&lt;h2 id="学习目标">学习目标&lt;/h2>
&lt;p>通过本文，你将全面掌握以下核心能力：&lt;/p>
&lt;ul>
&lt;li>深入理解 Whisper 的技术原理和架构设计&lt;/li>
&lt;li>学会安装配置 Whisper 环境和依赖&lt;/li>
&lt;li>掌握不同模型规模的选择和性能对比&lt;/li>
&lt;li>学会使用命令行和 Python 进行语音识别&lt;/li>
&lt;li>理解 Whisper 的多语言翻译和语言识别功能&lt;/li>
&lt;li>掌握性能优化和微调技巧&lt;/li>
&lt;li>了解 Whisper 的生态集成和应用场景&lt;/li>
&lt;/ul>
&lt;hr>
&lt;h2 id="1-项目概述">1. 项目概述&lt;/h2>
&lt;h3 id="11-是什么">1.1 是什么&lt;/h3>
&lt;p>&lt;strong>Whisper&lt;/strong> 是 OpenAI 发布的通用语音识别模型。它在大规模多样化音频数据集上训练，是一个多任务模型，可以执行&lt;strong>多语言语音识别&lt;/strong>、&lt;strong>语音翻译&lt;/strong>和&lt;strong>语言识别&lt;/strong>。&lt;/p></description></item></channel></rss>