基本资料 | |
软件名 | TALQu |
---|---|
开发者 | Haruqa |
操作系统 | Windows10 Pro 64bit |
语言 | 日语 |
软件类型 | 语音合成/TTS |
首次发布 | 0.1.0 |
稳定版本 | 1.3.0 |
TALQu(全称:TALQu 深層学習系読み上げソフト フリー/ドネーションウェア/TALQu 深度学习系阅读软件 免费/捐赠软件)是由Haruqa个人开发和发布的语音合成免费开源软件,前身为UTAU插件/软件SSYQu,于2021年2月22日正式公开。TALQu采用了深度学习系统,能使语音合成更为自然,并支持使用者制作自己的声库。
在认识UTAU后,Haruqa认为UTAU是“可以自由创造合成声音的软件”[1]。2012年,Haruqa发布了与自己同名的UTAU音源[2]。此后几年,Haruqa以UTAU为中心投稿,并开始研究UTAU调声。
为了更方便、更快速地调声,Haruqa为UTAU开发了语音合成插件[1]。Haruqa又认为开发一个耳语阅读软件会很容易,于是在2020年发布了可用作UTAU插件的软件SSYQu[3],通过此插件,UTAU可实现合成耳语。
在看开源深度学习语音合成软件资料的时候,Haruqa原以为“因为软件是英语世界做的所以只支持英语”,但后来发现核心部分与语言无关,所以试着做了合成。合成的结果出乎意料,于是Haruqa开始开发深度学习语音合成软件[1]。
软件最初挪用了SSYQu的代码,后通过更新增加了新的功能[4]。软件的名字“TALQu”由英语单词“talk”转化而来,“Q”取自开发者Haruqa名字中的“Q”[1]。
TALQu的开发自2020年12月7日起,共用了约两个半月。在2021年2月22日,也就是Haruqa的UTAU音源9周年时,Haruqa发布了TALQu[1]。
TALQu的第一个音源模型也是与其捆绑的默认音源模型为Haruqa。3月1日,CrazY发布了第二个TALQu音源模型,也是第一个民间自制音源模型Kurepoppo(くれぽっぽ)[5]。
3月23日,在兽音洛(式狼缘)的11周年之际,兽音洛的中之人yuuma发布了兽音洛的TALQu音源模型,这也是TALQu的第三个音源模型[6]。
4月4日,TALQu1.1.0版发布,在多句合成时增加了进度条、快捷键和调声参数变更GUI,合成时可选择命令提示符显示/不显示[7]。
4月26日,黑昴宿的TALQu音源模型与立绘一并公开,名为黑昴宿-AI Talk-[8]。
5月2日,TALQu1.2.0版发布,新增改变音高、音调功能,快捷键可在焦点对准时使用,并修复了一些bug[9]。
5月24日,波音律的TALQu音源模型和包含100个句子的语料库,373个用于学习的文件一同发布[10]。
5月26日,TALQu1.3.0版发布,更新了使用条约,追加了英语版使用条约[4]。
6月20日,欲音Ruko的TALQu音源模型公布,距离最近一次音源配布已过了近3年[11]。
6月25日,在东北伊达子的诞生祭上,使用ITA语料库[12]的东北伊达子TALQu音源模型制作成功[13]。
启动
打开TALQu.exe
播放
在“要读的句子”(読み上げる文)输入文字后,点击“播放”(再生)按钮即可播放。
停止
在播放时希望停止,点击“停止”(停止)按钮即可停止。
保存
通过“保存wav”(wav保存)将合成结果以wav格式保存。
如果想按原样保存在“播放”中的文件,点击“保存您刚刚听到的内容”(今聞いたのを保存)按钮。[14]
语速(話速):默认值为100,50为1/2倍速,200为2倍速。
西格玛(シグマ):默认值为0.666,减少可能减少非周期性声音,增加可能增加非周期性声音,极值可能引起噪音。
降噪器(デノイザー):默认值为0.1,减少可能增加噪声,增加可能减少噪声。
小voice长度(小ポーズの長さ):对应“、”的长度。
大voice长度(大ポーズの長さ):对应“。”的长度。
音高(声の高さ):默认值为1,0.5为向下一个八度,2为向上一个八度。
音调(声色の高さ):默认值为1,减少变男声(增加年龄),增加变女声(减少年龄)。[15]
禁止用于犯罪、恶作剧和恶意使用。
禁止重新分发。
禁止反编译、逆向工程和分析。
禁止提取、窃取内部逻辑、规格和设计。
禁止公开无意中获得的规格等信息,除了作者允许部分的重写,替换和添加可能的部分。
未经作者事先许可,禁止通过重写内部代码进行修改,公开修改结果,公开修改方法,对外发布、分发自动化操作工具。
此外,请遵守使用的TALQu音源模型的使用条款。
可自由为此软件的音源模型进行创建、分发、销售等。
规则如有更改,恕不另行通知。[16]
2021/05/26 1.3.0.0 利用规约更新、自动翻译英文追加、利用规约表示机能追加
深层学习系TTS「TALQu」用音声モデル、AI式狼缘(兽音ロウ)α版配布开始です!
复数文合成时のプログレスバー追加、ショートカットキー追加、调声パラメータ变更GUI追加
合成时のコマンドプロンプト表示/非表示设定
黑昴宿-AI Talk-の立ち绘ラフデザインの一部公开しました!
声の高さ·声色の高さ变更机能追加、ショートカットキーをフォーカス当たっていれば使用可能、他不具合修正
波音リツTALQu音源ファイル、コーパス文100、实际学习に使用した373ファイルの3つを配布します
ITAコーパスを使用した东北イタコさん(Normal)のTALQu音源が完成しました!
TALQu的booth页面:https://haruqa.booth.pm/items/2755336
TALQu wiki:https://w.atwiki.jp/talqu/
作者Haruqa的推特:https://twitter.com/niconicoHaruqa
作者Haruqa的YouTube:https://www.youtube.com/channel/UCyiq5Sc0eowiY8gKkVHFHsA
作者Haruqa的niconico:https://www.nicovideo.jp/user/26115723
咲耶记载的TALQu音源模型发布状况:https://yukaia.net/talqu-release-info/