なんJRVC部★9

0001 警備員[Lv.31] (ﾜｯﾁｮｲ b228-zyFg) 2024/09/24(火) 05:34:11.87

!extend:default:vvvvv:1000:512:donguri=1/3:
スレ立てのときは↑の!extend::vvvvv:1000:512を3行ぐらいに増やしてな

RVCとTTSとかの情報交換とかのスレ
ボイスチェンジャーで誰でも完璧に別人になりきることはできません。ボイストレーニングが必要です。
wiki: https://seesaawiki.jp/rvc_ch/

前スレ
なんJRVC部★8
http://fate.5ch.net/...veuranus/1720088109/ VIPQ2_EXTDAT: default:vvvvv:1000:512:donguri=1/3: EXT was configured

1 ID:bXgZ2h8/0(1/7)

0002 警備員[Lv.31] (ﾜｯﾁｮｲ 9228-zyFg) 2024/09/24(火) 05:36:53.76

ほ

ID:bXgZ2h8/0(2/7)

0003 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:37:48.29

乙やで！

ID:EvMigi1L0(1/13)

0004 警備員[Lv.31] (ﾜｯﾁｮｲ 9228-zyFg) 2024/09/24(火) 05:37:59.36

20まで

ID:bXgZ2h8/0(3/7)

0005 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:38:23.25

せやな

ID:EvMigi1L0(2/13)

0006 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:39:34.36

ちゅぱちゅぱ

ID:EvMigi1L0(3/13)

0007 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:40:32.28

ふんふん

ID:EvMigi1L0(4/13)

0008 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.31] (ﾜｯﾁｮｲ 9228-zyFg) 2024/09/24(火) 05:41:18.77

ｋｓｋ

ID:bXgZ2h8/0(4/7)

0009 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:42:30.55

特に書くネタないから悩むという

ID:EvMigi1L0(5/13)

0010 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:43:37.33

フンフンフン

ID:EvMigi1L0(6/13)

0011 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.31] (ﾜｯﾁｮｲ 9228-zyFg) 2024/09/24(火) 05:43:57.99

普段からスローペースだしね

ID:bXgZ2h8/0(5/7)

0012 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:44:14.60

うん

ID:EvMigi1L0(7/13)

0013 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:44:31.87

あとちょっと

ID:EvMigi1L0(8/13)

0014 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:45:01.95

フンフン

ID:EvMigi1L0(9/13)

0015 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.31] (ﾜｯﾁｮｲ 9228-zyFg) 2024/09/24(火) 05:45:40.23

はい

ID:bXgZ2h8/0(6/7)

0016 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:46:08.02

部屋寒くてビビるぜ

ID:EvMigi1L0(10/13)

0017 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:46:34.83

やっと秋なんやなって

ID:EvMigi1L0(11/13)

0018 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:46:50.67

ラストホッシュ

ID:EvMigi1L0(12/13)

0019 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][UR武][苗] (ﾜｯﾁｮｲ 9222-ZfBD) 2024/09/24(火) 05:47:05.40

🤗

ID:EvMigi1L0(13/13)

0020 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.31] (ﾜｯﾁｮｲ 9228-zyFg) 2024/09/24(火) 05:49:13.28

いったかな？

ID:bXgZ2h8/0(7/7)

0021 警備員[Lv.2][新芽] (ﾜｯﾁｮｲ 1203-w5sm) 2024/09/24(火) 10:03:19.69

いちおつ

ID:cW2t76/J0

0022 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][芽] (ﾜｯﾁｮｲ a71c-7hLx) 2024/09/24(火) 12:47:44.86

おつー

ID:BXPGMWpi0

0023 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.58][R武][SR防] (ﾜｯﾁｮｲ b37b-rNKn) 2024/09/24(火) 12:56:36.03

乙

ID:HpoVkaKU0

0024 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][新芽] (ｵｯﾍﾟｹ Sr47-5eDV) 2024/09/24(火) 19:39:04.56

あざす

ID:2sDkZ2cir

0025 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][新芽] (ﾜｯﾁｮｲ d291-d6Dm) 2024/09/24(火) 19:43:44.07

>>1
おつ
スクリプトさえ来なければここは居心地いいんだがな
ディスコはなんか話題に混ざりにくい

ID:mjxpyw490

0026 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.9][芽] (ﾜｯﾁｮｲ a770-7hLx) 2024/09/25(水) 05:00:42.23

nfswのasmrから学習させてるんだけど台本とかテキストデータがないから
文字起こしツール使ってるけど喘ぎとか声が乱れる部分はうまく書き起こせない
その辺はやっぱ手動でコツコツやるしかないんかな...

2 ID:SBSI5xco0(1/2)

0027 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.9][芽] (ﾜｯﾁｮｲ a770-7hLx) 2024/09/25(水) 05:02:01.74

>>26
nsfwだ、恥ずかし

ID:SBSI5xco0(2/2)

0028 警備員[Lv.1][新芽] (ﾜｯﾁｮｲ efbd-L8o3) 2024/09/25(水) 05:35:05.42

>>26
エロゲデータセットからファインチューニングされたwhisper使ってみるのはどうかな
URL貼れなかったけど、前スレの279にリンクあったよ

1 ID:FQb0jD4U0

0029 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][新芽] (ﾜｯﾁｮｲ 1203-w5sm) 2024/09/25(水) 07:12:17.47

>>28
あれ実際使ってみたらかなり精度悪かったで

ID:aPgq0aig0

0030 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.19] (ﾜｯﾁｮｲ 7239-rNKn) 2024/09/25(水) 10:28:43.25

エロ系の書き起こしならこれが結構精度いいよ
https://huggingface....l-novel-transcriptor

1 ID:1WsbNyI90(1/2)

0031 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.34] (ﾜｯﾁｮｲ 5f54-wdwF) 2024/09/25(水) 11:09:52.51

声が誰でもいいなら喘ぎ声なんて簡単につくれるんだけどな
ヌルモデルではなかなか難しい
ちょっと疲れ気味の声とかならいけるんだけど

ID:tQnimBLk0

0032 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.29] (ﾜｯﾁｮｲ 168f-7cnK) 2024/09/25(水) 11:20:59.37

エロ単語辞書を作って分かち書きしないとね

ID:T36jJ85W0(1/3)

0033 警備員[Lv.4] (ﾜｯﾁｮｲ 168f-7cnK) 2024/09/25(水) 18:59:43.14

わからんことでChatGPTとレスバしてると自信が無くなってくる

音声識別のモデルって例えばDeepSpeakerだと、識別させる為のもので、実際に音声識別で使うには
できたモデルで話者ごとの埋め込みファイルだかを作らないといけないのか。

モデルはその埋め込みファイルを作成するのに必要ということか

ID:T36jJ85W0(2/3)

0034 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4] (ﾜｯﾁｮｲ 168f-7cnK) 2024/09/25(水) 19:04:50.12

音声識別の際には埋め込みファイルを使うので、もう学習モデルはいらないという理解であってる？

ID:T36jJ85W0(3/3)

0035 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][新芽] (ﾜｯﾁｮｲ eb7b-7hLx) 2024/09/25(水) 20:29:59.75

>>30
赤ちゃん質問で申し訳ないです
この書き起こしモデルを使うには何が必要ですか？

1 ID:HvZkKHY+0(1/2)

0036 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.20] (ﾜｯﾁｮｲ 7235-rNKn) 2024/09/25(水) 20:40:49.71

>>35
style-bert-vits2ならgradio_tabsにあるdataset.pyを編集すればいいよ
他のアプリもどっかに記載されてるはずだからlarge-v3で検索するなりして探してみて
https://i.imgur.com/rryLB4Y.png

1 ID:1WsbNyI90(2/2)

0037 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][新芽] (ﾜｯﾁｮｲ eb7b-7hLx) 2024/09/25(水) 21:00:27.21

>>36
うわー！ほんとにありがとう！
凄い助かる、いやほんとありがとうございます！

ID:HvZkKHY+0(2/2)

0038 警備員[Lv.6] (ﾜｯﾁｮｲ 168f-7cnK) 2024/09/26(木) 06:17:14.30

DeepSpeakerも学習させる音声は短いのダメ、無音ダメがある
しかもDeepSpeakerはそれが原因で正常に識別しないまであり凶悪

ID:rfbkWtL70

0039 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.9] (ﾜｯﾁｮｲ 168f-7cnK) 2024/09/27(金) 09:37:15.68

DeepSpeakerとりあえず、エポック100では正常に音声識別できない
エポックを上げて行きます。

ID:gtgK9dJX0

0040 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.59][R武][SR防] (ﾜｯﾁｮｲ b37b-rNKn) 2024/09/27(金) 23:26:31.06

久しぶりにSBV2で学習させてみたで
これがオーソドックスなママ系ボイス
https://files.catbox.moe/p1z6n9.mp4
これはダウナー系闇属性な感じのボイス
https://files.catbox.moe/by6fj1.mp4

1 ID:MT7/p8b50

0041 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][芽] (ﾜｯﾁｮｲ c607-w5sm) 2024/09/28(土) 17:20:46.76

>>40
オーソドックスなママの圧倒的説得力

ID:3q1eCK1V0

0042 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.57] (ﾜｯﾁｮｲ 2328-7uza) 2024/09/29(日) 22:32:26.55

そういやBOOTHにStyle-Bert-VITS2の怪しいモデル大量投下してた業者、検索に引っ掛からんな
消えたんだろうか

ID:PaOl8UHz0

0043 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ b368-puBW) 2024/10/02(水) 15:03:03.06

声優とかの声を学習させたりマージさせた声のモデルって、どのくらい権利者の声が残っていたらアウトなんだ？逆にセーフな場合ってある？

ID:TMmIS8mA0

0044 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.17] (ﾜｯﾁｮｲ c37d-bM6e) 2024/10/02(水) 15:52:34.02

名前を上げたらアウト

ID:oXbqg4130(1/2)

0045 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][芽] (ﾜｯﾁｮｲ ff03-eLKd) 2024/10/02(水) 20:05:24.96

裁判待ちや
声優名で売ったらアウトだけどキャラ名ならOKかもみたいな議論もある

ID:WkhjjfB30

0046 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.18] (ﾜｯﾁｮｲ c37d-bM6e) 2024/10/02(水) 20:06:34.39

芸能人のモノマネ芸人もアウトになる？

ID:oXbqg4130(2/2)

0047 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.13][芽] (ﾜｯﾁｮｲ 8fc9-eLKd) 2024/10/02(水) 21:40:35.90

法律的には対策されてないからセーフなんだろうけど
本気で鬱陶しいと思われたら変化球で仕留められるやろうな
リスペクトの無い人間が表で成功する事は無い

ID:sQ4zTwCN0

0048 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.3][新芽] (ﾜｯﾁｮｲ 23a3-E7JI) 2024/10/03(木) 06:58:00.43

生成は変化球で落とせる
抽出した特徴に変換するボイチェンは使用者の音声がベースになるんで権利周りでは落とせない
マージモデルを訴えるには「証拠はないが似てるから違法」という主張が認められないといけないので事実上の無敵
それらとは別にモデルを解析されて学習素材を特定できるのなら、間違っても研究目的の学習にはならんのでアウト
音声から「似てるからアウト」に持ち込むには声色の人権が法的に認められないといけないが、それだと声真似や声優同士の争いに発展し、ゲームの特許のように後発の妨害に使われるのであり得ない

法律で落とすには、せいぜい「名義を名乗らなくても、特定個人の特徴を模倣し損害を与えたら認める」という判例が増えないことには弁護士も動かない

ID:OzMbS35q0(1/2)

0049 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][芽] (ﾜｯﾁｮｲ 23a3-E7JI) 2024/10/03(木) 07:20:27.39

法律のセーフってのは原則なくて、裁判で勝てないから結果的にセーフが正しい
だから民事では証拠にたどり着けないようにするとか
常にノーログVPNで活動するとかやればいい

ID:OzMbS35q0(2/2)

0050 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][芽] (ﾜｯﾁｮｲ b376-LKYk) 2024/10/03(木) 10:58:59.87

声優Aと声優Bと声優Cをブレンドしたらもう判別しようがないもんな

ID:vXI/UNl40

0051 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.24] (ﾜｯﾁｮｲ 6f5a-8s9Z) 2024/10/04(金) 03:39:02.59

芸能人のものまねとかもアウトだよ
だってわざとにさせてるんだから

ID:tXd4wuhW0

0052 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][芽] (ﾜｯﾁｮｲ 23a3-E7JI) 2024/10/04(金) 07:11:15.75

それはAIがなくても同じ
悪意的であったり元の人気を利用したら権利者が動く
日本が頑なに現行法でいいと繰り返すのも悪意かあれば対応できるから

ID:PvmnVeLh0

0053 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.15] (ﾜｯﾁｮｲ ff8f-3hiK) 2024/10/04(金) 10:29:54.98

家族の声真似をして振り込め詐欺を働くのは犯罪です。
AIで他人の音声を生成することは犯罪ではありません。
むしろ犯罪ではないものを犯罪呼ばわりすることが犯罪

ID:nFMtCM6o0

0054 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.15][芽] (ﾜｯﾁｮｲ 8f8b-eLKd) 2024/10/04(金) 11:06:58.81

こういう一発で基地外と10割の人間が認定するのが沢山いたから
生成AI全体が嫌われたっていう経緯があるけど

こんなステレオタイプな基地外が存在する訳無いので
生成AIを敵視させるための演技なんだろうね

ID:P5wa7kgk0

0055 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ e3b2-eLKd) 2024/10/04(金) 18:09:40.64

久しぶりに学習させて遊びたいんだけど今一番精度高いツールって何？ゲームvcとかで使える範囲の返還速度で

ID:xoEEBDwI0

0056 警備員[Lv.28] (ﾜｯﾁｮｲ cf2d-D2eP) 2024/10/05(土) 19:47:36.57

ボイチェンならまだ精度求めるならRVC（の派生版Applioがメジャーかな）
精度犠牲にして速度求めるならBeatrice

ID:tTASUedc0

0057 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.7][新芽] (ﾜｯﾁｮｲ bf7d-bM6e) 2024/10/05(土) 22:51:51.82

スーパートーンシフト

1 ID:zNPBUn5t0

0058 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][芽] (ﾜｯﾁｮｲ 8a91-uanK) 2024/10/06(日) 07:56:14.17

>>57
学習できねぇだろうせろや

1 ID:PG8hCZp70

0059 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.10][芽] (ﾜｯﾁｮｲ 7a7d-FGP3) 2024/10/06(日) 12:03:47.81

>>58
笑い声とか変換できるのはスーパートーンシフトだけだろうそうだろ？

ID:z07c/JV90

0060 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][芽] (ﾜｯﾁｮｲ 4a28-f3Lt) 2024/10/06(日) 12:49:30.27

日本語を扱えるものはこの数ヶ月でそれほど大きな進化はないようだけど
中国語や英語はもっと伸びてるのかな？

ID:tRGV4QEL0

0061 警備員[Lv.28] (ﾜｯﾁｮｲ de2d-AbR9) 2024/10/06(日) 15:47:50.49

スーパートーンシフトの内部の人がステマしてるんやったら、こっそりモデルリークして誰でも学習できるようにしてくれや

1 ID:G5OvVkdl0

0062 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.7][芽] (ﾜｯﾁｮｲ 9ba3-Zadx) 2024/10/07(月) 06:40:52.25

NAIのように流出したら時代が動くぞ

ID:63R0XeyT0

0063 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.12][芽] (ﾜｯﾁｮｲ 0625-hOPt) 2024/10/07(月) 17:44:36.43

>>61
ぶっちゃけんなわけないやん
こんな過疎スレに来てるわきゃないない

ID:UihP3GMB0

0064 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.25] (ﾜｯﾁｮｲ 8a8f-hOPt) 2024/10/07(月) 18:27:26.27

“AI野沢雅子”や“AI銀河万丈”を提供へ　声優事務所・青二プロが音声AIベンチャーと提携
https://www.itmedia....2410/07/news059.html

ID:pG2uEej70

0065 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.52] (ﾜｯﾁｮｲ e7aa-KtQj) 2024/10/07(月) 18:41:09.38

TTSとか対話用のインターフェースに比べるとリアルタイムVCはあんまり賑わってないねぇ
有志開発者も研究も

ID:lh3rMniY0

0066 警備員[Lv.28] (ﾜｯﾁｮｲ de2d-AbR9) 2024/10/07(月) 19:13:49.42

限界が今のところ見えてるからやろうなあ

ID:Fe28Gfzi0

0067 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.8][芽] (ﾜｯﾁｮｲ 4e30-pV6A) 2024/10/08(火) 22:59:33.55

sbv2でブルアカキャラ学習したもの使って動画作る程度じゃなくyoutubeで広告つけて実況は無法だなぁ
sbv2に飛び火しねぇでくれよ〜

2 ID:tlYa96vS0

0068 警備員[Lv.9][芽] (ﾜｯﾁｮｲ 86bf-w5St) 2024/10/09(水) 12:05:00.86

>>67
見てみたい
リンクはってくれ

1 ID:4U2EOJ480

0069 警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 1b4a-AbR9) 2024/10/09(水) 20:26:35.02

>>67
監視したいからリンクくれ

1 ID:QKBZE7o30

0070 警備員[Lv.4][新芽] (ﾜｯﾁｮｲ 1b4a-AbR9) 2024/10/10(木) 18:19:48.96

某データセットから加工してWhisperのファインチューンに使いやすいようにしたデータセットを公開した
huggingface.co/datasets/litagin/Galgame_Speech_ASR_16kHz
試しに自分で回そうとしてみるけどうまくいくかは分からん、NSFW音声ちゃんと書き起こせない問題がどうにかできればええんやが

ID:Z0sukNC10(1/2)

0071 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 5f91-pV6A) 2024/10/10(木) 19:18:03.83

Style-Bert-VITS2についての質問なのですが、データセット作成の文字起し処理にて

File "subprocess.py", line 505, in run
File "subprocess.py", line 1144, in communicate
File "codecs.py", line 322, in decode
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8e in position 931: invalid start byte

のようなエラーが出続けています。
WebUI版なのですが、何を修正すればよろしいでしょうか。
sbv2フォルダはローカルディスク直下で、パスに日本語は含まれていないはずです。

ID:jlrEsAfM0

0072 警備員[Lv.5][芽] (ﾜｯﾁｮｲ 1b4a-AbR9) 2024/10/10(木) 20:20:48.89

ffmpegが入ってないのはず、というかそれ報告めっちゃ多いのでどうにかしたいと思いつつどうすればいいか分からん

ID:Z0sukNC10(2/2)

0073 警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 4e4a-5M6e) 2024/10/10(木) 23:15:04.53

手っ取り早く精度高い女性の声を手に入れたいのですが、「rvc学習済みモデル」ってどうなのでしょうか？
1万超えのものはがびったりしないのでしょうか。
あみたろを自分で学習させたものだとどうしても、ところどころおかしく、ボイチェンしてるなって分かってしまいます。
1万ごえのもの使ったことある方教えて頂けると嬉しいです。

ID:rW2QUBqA0

0074 警備員[Lv.6][芽] (ﾜｯﾁｮｲ 1b4a-AbR9) 2024/10/11(金) 01:05:45.34

怪しい業者のを買うより自分でデータ集めて作るのがいい

ID:iD1+3g5w0

0075 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.7][芽] (ﾜｯﾁｮｲ 8a91-uanK) 2024/10/11(金) 01:24:36.54

VCClient最新版入れると自動でついてくるBeatriceでいんじゃね
あれディレイ少ないし声の種類も多くて結構遊べる

ID:SrZq3yOq0

0076 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][芽] (ﾜｯﾁｮｲ 0625-hOPt) 2024/10/11(金) 18:36:02.24

>>68
>>69
その人が言ってる動画かはわからんが
ずんだおばけってチャンネルがそんな事やってたよ

ID:QyMJFqIv0

0077 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.11][芽] (ﾜｯﾁｮｲ 9e2b-+RYi) 2024/10/12(土) 18:31:35.88

だいぶ前にあったSBV2のjp_extra_largeモデル、当時学習で失敗し続けてそのままだったんだけど、再チャレンジでいけたのでメモ。
・ SBV2は最新版に更新
・この通常版SBV2は念のためバックアップとっておく。jp_extra_largeにすると過去学習したファイルが使えなくなるみたいなので。
・ jp_extra_largeのファイルをSBV2に上書きする。
・データセットは通常通り用意する。自分は過去使用のデータセットをそのまま流用した（モデル名変更したのでエディタ編集は実施）。
・学習に要するメモリは通常より多めに使われる印象。一度GPUメモリの状態を確認して調整したほうがいいかも。
・ SBV2同梱のエディタはjp_extra_largeで作ったものなら普通に動いた。
・結果は、「あっ」とか過去に崩れやすかった応答が良くなった気がする（ダメな応答も多いけど）。
・あと若干声が跳ね気味かな。このあたりは自分のデータセット棋院かもしれないけど、念のため。

とりあえずサンプル。絵は念のため劣化させてるので、心の目で見てもらえると有難いで。
s://litter.catbox.moe/mgxefq.mp4

ID:BGJGB6vw0

0078 警備員[Lv.5][芽] (ﾜｯﾁｮｲ 4b4a-LxNv) 2024/10/16(水) 11:18:55.48

huggingface.co/AkitoP/whisper-large-v3-japense-phone_accent
ワイの上げたコードどデータセットで読みアクセント推定するWhisperモデル作ってる中華ニキがいてすごいなあと思った
こっちは現在普通にWhisperファインチューン中やから、NSFW書き起こしや、普通のやつでも原音忠実に書き起こせるやつを学習しとるからそのうち共有する

ID:vwHXD23h0(1/2)

0079 警備員[Lv.5][芽] (ﾜｯﾁｮｲ 4b4a-LxNv) 2024/10/16(水) 11:19:21.16

GPT-SoVITSの読み入力はこのpyopenjtalk_prosody形式らしいから、そっちの学習データ準備には使えるかもな

ID:vwHXD23h0(2/2)

0080 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.36] (ﾜｯﾁｮｲ db2a-wMW8) 2024/10/16(水) 21:31:05.15

この前公開されたOpenAIのRealtimeAPIの出力をRVCの入力にするようにコード改造してお喋りしてみた
色々可能性を感じるけどAPI料金が高いから長時間遊んでると危ないなｗ

ID:Xj4U+4/30

0081 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.36] (ﾜｯﾁｮｲ db2a-wMW8) 2024/10/17(木) 08:06:01.87

せっかくだからURL置いとく
https://github.com/b.../RealtimeAPI-WithRVC

ID:aw4eJkqw0

0082 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.54] (ﾜｯﾁｮｲ 5be2-rMRc) 2024/10/17(木) 17:09:51.75

vocoflexって無理矢理VC化できるのかな？
あと新しく出たSeedVC、ゼロショットにしては性能かなり高いけど教師データ増やしたらどうなるんだろう
そもそも教師データ増やせるような仕組みになってるのかな？
ちゃんと読んでないからわからん

ID:A1bzXqML0(1/2)

0083 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][芽] (ﾜｯﾁｮｲ ef98-nmm0) 2024/10/17(木) 17:12:55.89

Seed-vcっていう新しいボイスチェンジャーに関する記事があったから
wikiに紹介ページ作ってついでにインストール方法書いておいたで

1 ID:/S+HyJW/0

0084 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.36] (ﾜｯﾁｮｲ 9f8f-qfF2) 2024/10/17(木) 17:16:30.59

RVCより性能悪いんでしょ？

ID:lslqRzOv0

0085 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.54] (ﾜｯﾁｮｲ 5be2-rMRc) 2024/10/17(木) 17:18:47.94

ターゲットデータ10秒のデモ音声しか聞いたことないからまだわからんな(その音声もターゲット側が知ってるキャラじゃないから品質がいいかよくわからん)
使ってみるか

1 ID:A1bzXqML0(2/2)

0086 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.8][芽] (ﾜｯﾁｮｲ 9f28-v0M5) 2024/10/17(木) 17:27:05.80

手持ちの音源で試したけどゼロショットでここまでできるのは凄いなって感じで
実用化にはもう少し時間がかかりそうな印象だった

1 ID:wnEhs4iG0

0087 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.46] (ﾜｯﾁｮｲ 5ba3-MJzj) 2024/10/17(木) 19:26:27.06

発展性や選択肢が増えるのはいいことだ

ID:FqfqI90s0

0088 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ ef59-EWSR) 2024/10/18(金) 07:02:40.01

新しい選択肢がなかなか増えないのは困るが、技術者が無名であるほど企業に狩られない利点もある
俺らにとっては騒ぎ立てないほうが都合がいいのさ

ID:/xk4AKtK0

0089 警備員[Lv.20] (ﾜｯﾁｮｲ ef26-nmm0) 2024/10/19(土) 15:49:23.38

いま、有名人の声で曲を歌わせるなら、AIに音声学習させるよりもＵＴＡＵで人力ボカロする方が効率的だよな？

ID:cNnWFOnB0

0090 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.39] (ﾜｯﾁｮｲ 9f8f-qfF2) 2024/10/19(土) 20:36:59.86

AI技術で生成した音声データを使ってアイドルマスターの水瀬伊織に粛聖!! ロリ神レクイエム☆を歌わせてみた。
https://www.youtube..../watch?v=IatLBMJ7Fw4

1 ID:CkApcDd/0

0091 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.35] (ﾜｯﾁｮｲ 8b54-peNt) 2024/10/19(土) 23:47:44.86

そいつあげてる動画やべえのばっかだな
こんなのyoutubeに上げてるのバカなのか

ID:8LiAyCV10

0092 警備員[Lv.20] (ﾜｯﾁｮｲ c63e-MMaT) 2024/10/20(日) 00:21:52.69

>>86
ゼロショットってことどゆこと？
GPT-SoVITSてきなものなの？

1 ID:IOL7Y+G40(1/2)

0093 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.58] (ﾜｯﾁｮｲ 81c3-6Oo2) 2024/10/20(日) 07:36:57.48

世間が無知な事に付け込んでAI歌手とか歌わせてみたとか吹聴してるけど
その手の動画って全部元音声をボイチェン変換してるだけだから滅茶苦茶悪質なんだよな
別に歌詞や曲からAIが歌っているのではない

1 ID:d9tO33Lu0

0094 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.2][新芽] (ﾜｯﾁｮｲ 8d9b-ZQ4s) 2024/10/20(日) 08:53:45.07

>>93
お前は何を言ってるんだ？

ID:npUtc8q10

0095 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][新芽] (ﾜｯﾁｮｲ e56d-DaMJ) 2024/10/20(日) 10:58:27.23

無知なのは世間ではなくて…

ID:8cx6jd3J0

0096 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.30] (ﾜｯﾁｮｲ 6d57-UHg7) 2024/10/20(日) 12:32:51.88

>>90
釘宮理恵のディープフェイクと言いなおそう

ID:Xcl0DvAB0

0097 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.28] (ﾜｯﾁｮｲ 85e2-JLuo) 2024/10/20(日) 12:44:12.99

>>92
教師データの数だよ～
1つの音素やラベルに対してだいだい数個くらいしか教師が無くても動くRVC→ワンショット
SeedVCみたいにそもそもほとんどの音素に教師がなくても動く→ゼロショット

ID:T6QRe9rC0(1/4)

0098 警備員[Lv.6][芽] (ﾜｯﾁｮｲ d14a-6/Jd) 2024/10/20(日) 14:35:54.18

いやターゲット話者の声をどう使うかの違い
RVCはターゲット話者でのファインチューン（モデル自体に追加学習）必須だからゼロでもワンでもない、ただのファインチューン
ファインチューンせずにもとのモデルのままで、ターゲット話者の音声をちょっと与えただけでその声にボイチェンなりTTSするのがゼロショットもしくはfew shot

ID:Ksq3zYeG0(1/3)

0099 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.28] (ﾜｯﾁｮｲ 85e2-JLuo) 2024/10/20(日) 15:39:39.77

各ラベルにおいてデータがただ1個の場合は、「ワンショット」と呼ばれています。もっと極端な場合が、ゼロショット（予測したい対象のデータを新たに学習することなく行う予測）です。

昔これ読んで勝手にデータ数の違いだと思って勘違いしてた
教えてくれて感謝

ID:T6QRe9rC0(2/4)

0100 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.29] (ﾜｯﾁｮｲ 85e2-JLuo) 2024/10/20(日) 15:58:21.93

すごい初歩的なこと聞いてごめんだけど転移学習とone shot、few shotは別に相反する概念ではない？
つまり少ないデータでファインチューニングとか転移学習した場合ってファインチューニングかつfew shotが両立する？
https://www.ibm.com/...ew-shot-learning(FSLの手法として転移学習が紹介されてるので)
というかそもそもfew(one) shot生成とfew(one) shot学習ってもしかして若干意味違う？俺何もかも勘違いしてたかも知れない

ID:T6QRe9rC0(3/4)

0101 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.29] (ﾜｯﾁｮｲ 85e2-JLuo) 2024/10/20(日) 16:04:23.32

自然言語処理の場合https://atmarkit.itm...2308/03/news016.html
ファインチューニングせずプロンプトに少数の例を入れるの意味で
識別タスクとかだと普通にファインチューニングも1手法っぽいな
わかんね～

ID:T6QRe9rC0(4/4)

0102 警備員[Lv.7][芽] (ﾜｯﾁｮｲ d14a-6/Jd) 2024/10/20(日) 18:42:14.95

x.com/prj_beatrice/status/1847837728429527404
beatriceがアプデされたらしいで、質が上がったとの噂

1 ID:Ksq3zYeG0(2/3)

0103 警備員[Lv.7][芽] (ﾜｯﾁｮｲ d14a-6/Jd) 2024/10/20(日) 18:47:33.27

few/zero/one shotについての正確な定義は知らん、たぶん音声界隈じゃある程度みんなごっちゃにしとる雰囲気ある

ID:Ksq3zYeG0(3/3)

0104 警備員[Lv.20] (ﾜｯﾁｮｲ c692-MMaT) 2024/10/20(日) 22:09:50.35

>>83
これ試してみたけどGPT-SoVITSの上位互換ってことでいいよね？

ID:IOL7Y+G40(2/2)

0105 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.9][芽] (ﾜｯﾁｮｲ 0228-Ml+U) 2024/10/20(日) 22:47:57.42

上位互換とは？
TTSとVCを比べても意味ないでしょ

ID:D5oBGfZr0

0106 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.8][芽] (ﾜｯﾁｮｲ c291-vkxp) 2024/10/21(月) 01:17:15.97

>>102
これ、誰か学習試してみてくれねぇかなぁ
CPUのみで変換出来てディレイも少なくて音も綺麗でなおかつ学習も出来る、ってこれが本当なら余裕でRVCを超えるシロモノなわけだが…

ID:Ot/ddj3G0(1/2)

0107 警備員[Lv.9][芽] (ﾜｯﾁｮｲ d14a-6/Jd) 2024/10/21(月) 19:38:55.66

とりあえず自分で試してみれば

1 ID:MnTMwn/c0

0108 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.9][芽] (ﾜｯﾁｮｲ c291-vkxp) 2024/10/21(月) 20:35:07.93

>>107
激務中でな…
暇になったら試してはみたいが

ID:Ot/ddj3G0(2/2)

0109 警備員[Lv.10][芽] (ﾜｯﾁｮｲ d14a-6/Jd) 2024/10/22(火) 14:12:05.20

ワイも最近はWhisperにNSFW単語認識させようと頑張って忙してくてな
前より質が上がったという声はまあまあ上がっとる、手持ちデータで1時間だけ学習回したけどそこまで劇的にRVCほど良くなったかと言うと微妙かもしらん
（ボイチェンに実際には使ってなくてtensorboardでのテストデータ聴いただけやが）

ID:B2BftqvU0(1/2)

0110 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.40] (ﾜｯﾁｮｲ c28f-YTH6) 2024/10/22(火) 15:56:24.22

Deeplとかで単語ごと検索かけて音声ファイルにして、辞書作れば？

ID:dZv05dsK0

0111 警備員[Lv.11][芽] (ﾜｯﾁｮｲ d14a-6/Jd) 2024/10/22(火) 16:01:19.45

そもそもハルシネーションしたりして正常な書き起こしにならんからな
今更やけどWhisperファインチューンすれば結構行けることに気づいたのでクラウドGPUに課金してずっと学習回しとる
そのうち共有する

ID:B2BftqvU0(2/2)

0112 警備員[Lv.15] (ﾜｯﾁｮｲ c63d-DaMJ) 2024/10/22(火) 20:20:42.37

aivis datasetって　sbv2に内蔵されてるやつでええんよな？

別にアプリ使う必要ないよね

ID:PiK1HSPd0

0113 警備員[Lv.12][芽] (ﾜｯﾁｮｲ d14a-6/Jd) 2024/10/24(木) 13:12:54.96

ええで、メンテしとらんしな

ID:WgRAyui10

0114 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.12][芽] (ﾜｯﾁｮｲ 61db-dzAR) 2024/10/25(金) 10:41:48.85

t5 tts試そうとしたら英語と中国語しか対応しとらんくておわった

ID:qbM/8WP90

0115 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.9][芽] (ﾜｯﾁｮｲ c18f-IjZm) 2024/10/30(水) 10:16:13.46

deep-speakerはいまいちだったけど、pyannote.audioは結構使えると最近気づいた。

ID:8kZHWvIA0

0116 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だったころころ (ﾜｯﾁｮｲ 5359-HqYs) 2024/10/31(木) 07:02:20.21

声に著作権つけたら声真似連中から声を奪われたと訴訟されまくるかもな
波形で判別するってのはそういうこと、声優が守られる側になる保証はねえってことだな

ID:lVXrQmAS0

0117 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ c1a6-hZLL) 2024/11/01(金) 14:54:06.88

DMMボイス試してみたけど、JP-EXTRAじゃないほうのモデルを使ってるのかな？中国語訛りっぽいし、英語喋れるし

ID:N6JiEx9n0

0118 警備員[Lv.13][芽] (ﾜｯﾁｮｲ f94a-hZLL) 2024/11/01(金) 16:06:04.19

DMMボイス、もろ普通に知っとる声優の声で草だった

ID:lJFUr3LL0(1/2)

0119 警備員[Lv.14][芽] (ﾜｯﾁｮｲ f94a-hZLL) 2024/11/01(金) 18:44:04.94

DMMボイス、「ちゅぱちゅぱれろれろ」という謎の並びの単語が正常に音声合成できず吐息みたいになり、でもカタカナのチュパチュパレロレロだと正常に音声合成されることからして、ほぼ確実に学習データにエロゲあるな
そして男性でも同じことが起きてるから、たぶん多話者モデルとして学習されとる
SBV2ベースとか噂言われとるがサンプリングレートが半分になっとるし辞書とかは明確に強くなってるみたいで分からん

ID:lJFUr3LL0(2/2)

0120 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.15] (ﾜｯﾁｮｲ c18f-IjZm) 2024/11/01(金) 18:59:48.99

ゆっくりムービーメイカーだかの方がすごいね

ID:gBRSoKWp0

0121 警備員[Lv.14][芽] (ﾜｯﾁｮｲ f9b4-zc+1) 2024/11/01(金) 19:15:01.32

素人質問になってしまって恐縮やが
wavファイルを発声者ごとに自動で切り分けてくれるソフトってあるの？

1 ID:ey70YIbm0

0122 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.38] (ﾜｯﾁｮｲ 1954-mw43) 2024/11/01(金) 19:28:36.40

流石にこんだけ有名声優集めたのでエロゲデータをベースには入れてないんじゃないの

ID:zwaJuIV90(1/2)

0123 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.38] (ﾜｯﾁｮｲ 1954-mw43) 2024/11/01(金) 20:05:27.11

と思ったが膣内をなかないと認識するスケベAIだわ

ID:zwaJuIV90(2/2)

0124 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.17] (ﾜｯﾁｮｲ c18f-IjZm) 2024/11/02(土) 05:52:27.38

>>121
それがpyannote.audioなんだけど
結構間違えるな、結局人間が整理しないとだめかな

ID:vOkLX99J0

0125 警備員[Lv.14][芽] (ﾜｯﾁｮｲ f94a-hZLL) 2024/11/02(土) 07:49:39.28

一般ではあんまみないけどエロゲでよく見る声優とかもおるしな

ID:4VP8+L2z0

0126 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.13][苗] (ﾜｯﾁｮｲ 93a9-v/et) 2024/11/02(土) 12:15:28.56

colabの環境構築で重くなるのなんとかならんか

ID:FGaSHMc80

0127 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.56] (ﾜｯﾁｮｲ 327c-guIA) 2024/11/04(月) 01:05:18.07

DMMボイスでAIエロボイスの未来を感じた

ID:Y3CnEe250

0128 警備員[Lv.15] (ﾜｯﾁｮｲ d94a-guIA) 2024/11/04(月) 04:42:55.96

品質的にはBert-VITS2からそこまで変わってる感じはしないけどな
誰でも使いやすくしただけという感じ

1 ID:9KUR/3Nt0

0129 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.17] (ﾜｯﾁｮｲ 6588-guIA) 2024/11/04(月) 14:50:17.22

これで一般人にもAIボイスの凄さの片鱗がわかっただろうな

ID:k3qIeZgp0

0130 警備員[Lv.16] (ﾜｯﾁｮｲ d94a-guIA) 2024/11/06(水) 20:04:55.45

DMMボイスアクセス多すぎで停止しててワロタ

ID:zWfOc5PE0

0131 警備員[Lv.13][芽] (ﾜｯﾁｮｲ 6e8f-CyeO) 2024/11/07(木) 02:49:50.53

>>128
ここまで簡単にしてくれたのに知らなかったとか想像以上に無能無産が多いって事だわな
生成AI関連って99%の声だけがデカい無能が1%の有能の足を引っ張り続けるってのが
NAIリークからずっと続いとる

1 ID:HRNDbOZo0

0132 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.25] (ﾜｯﾁｮｲ 5927-yJSX) 2024/11/07(木) 03:53:17.66

SVB2使ってる俺スゲーは流石に草

ID:NK2sopsF0

0133 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.18] (ﾜｯﾁｮｲ 197d-I+MZ) 2024/11/07(木) 07:09:34.76

>>131
手描きの絵描き反AI派が生成ボイス使っててワロタᴡ

ID:+WD0QLNO0

0134 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ f625-kEEx) 2024/11/07(木) 20:06:12.41

たかし君はほんとにAI音声作るのがじょうずだねぇ

ID:yl2GVa2T0

0135 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.38] (ﾜｯﾁｮｲ a954-xrDM) 2024/11/08(金) 11:43:44.52

DMM死亡してる

1 ID:pS0pStR80

0136 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.2][新芽] (ﾜｯﾁｮｲ 6988-HUMF) 2024/11/08(金) 19:25:11.98

ボイチェンじゃなくてAI音声に喋らせるのはどこのスレに行けばええんや？

ID:nNqUvvjH0

0137 警備員[Lv.16] (ﾜｯﾁｮｲ d94a-guIA) 2024/11/08(金) 19:59:04.69

ここが音声AI総合スレになっとるからここでええで

ID:lSoLGK+00

0138 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.7][新芽] (ﾜｯﾁｮｲ a97c-guIA) 2024/11/09(土) 00:53:14.14

>>135
マジやんちょっとーーーーーーーー
早く製品出して

1 ID:cwTjfTQN0(1/2)

0139 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.7][新芽] (ﾜｯﾁｮｲ a97c-guIA) 2024/11/09(土) 00:54:30.46

AI音声がここまで注目されたのは素晴らしい事だよね
ボイスピークとかも、このレベルにバージョンアップして購入者には無料でｗ

ID:cwTjfTQN0(2/2)

0140 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.18][苗] (ﾜｯﾁｮｲ d2a9-Yjlv) 2024/11/09(土) 07:13:05.21

>>138
Bert-VITS2と検索すれば好きな音声で使えるぞい

ID:w0RHXzcN0

0141 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.17] (ﾜｯﾁｮｲ e93b-mTXz) 2024/11/09(土) 09:08:18.17

GPT-soVITSとsilly tavernの連携できてる人おる？
やり方を教えてほしいんや

ID:oChoQOdl0

0142 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.68][SSR武][SR防] (ﾜｯﾁｮｲ 657b-4b4N) 2024/11/09(土) 10:15:45.86

https://files.catbox.moe/g4gfpn.mp4
傾向の似ている4話者ぐらいのモデルをマージしたらママの概念みたいなTTSモデルできたわ
学習データと聴き比べてみたけど絶妙にどれとも被ってなくてキレイに足し算できてる気がする
ただこうやってマージしてくとマスピ顔ならぬマスピ声みたいになっていくんやろな

ID:KFtBzxam0

0143 警備員[Lv.17] (ﾜｯﾁｮｲ 454a-/Xjz) 2024/11/13(水) 19:01:16.44

https://huggingface....itagin/anime-whisper
喘ぎ声やチュパ音をちゃんと書き起こせるよう、例のデータセットでクラウドGPUでファインチューニング頑張ったモデル公開した
NSFWとか関係なく普通に大量良質データで学習させたことで、音声に忠実に書き起こしたり句読点正確についたりして、普通に使うにもなかなか良いモデルだと思うから使ってや

6 ID:r5XTFPHs0

0144 警備員[Lv.62][苗] (ﾜｯﾁｮｲ 23cf-zY9l) 2024/11/13(水) 21:19:33.59

>>143
軽く手持ちのデータ食わせただけでレベチだと分かるの凄いわ

ID:+SR4zU6w0

0145 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.18] (ﾜｯﾁｮｲ a3a9-LdP8) 2024/11/14(木) 06:55:34.63

>>143
colabでも使える？

ID:rXS1Dj1I0

0146 警備員[Lv.6][芽] (ｽｯｯﾌﾟ Sd43-x+fa) 2024/11/14(木) 14:08:05.04

>>143
凄そう、今日帰ったら試したいなぁ

ID:nsQPrKOfd

0147 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 0518-DOBF) 2024/11/14(木) 14:37:35.29

すごいけども
文字起こしにそんな困ってもないなってところ

ID:+swRsU740

0148 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.80] (ﾜｯﾁｮｲ cd4a-ISYn) 2024/11/14(木) 17:15:29.67

>>143
SVB2に読み込ませて使ってるけどかなり精度が高くて驚いた
ただhugのdemoページの書き起こしとは出力される文章が若干違っててdemoページ書き起こしの方がより正確に書き起こしてくれるんだけど
この違いはなんだろう

1 ID:BGSBYtpc0

0149 警備員[Lv.18] (ﾜｯﾁｮｲ 454a-/Xjz) 2024/11/14(木) 21:22:24.56

>>148
渡してるgenerate_kwargsの違いやないかな、それ以外は同じはず

1 ID:nZCjiF110

0150 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.80] (ﾜｯﾁｮｲ 1d83-ISYn) 2024/11/14(木) 22:02:46.61

>>149
無知な質問で申し訳ないのですが、モデルの追加はgradio_tabsのdataset.pyに変更を加えたのですが、そのgenerate_kwargsのパラメータはどこから変更するのでしょうか。

1 ID:HNhXK5EV0

0151 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 2325-ST7W) 2024/11/14(木) 22:30:07.82

>>143
凄いねこれ
楽しくなったのでついマイクに俺のチュパ音やら喘ぎ声囁いちゃったわ
40のおっさんが喘いでる地獄絵図ですよ

ID:FK23hASG0

0152 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][芽] (ﾜｯﾁｮｲ cd5f-Wbos) 2024/11/15(金) 05:57:42.60

>>143 うおお、ありがとう。週末試してみたい

ID:LjCboncS0

0153 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.80] (ﾜｯﾁｮｲ 1d0f-ISYn) 2024/11/15(金) 11:46:21.00

>>150
自己解決出来ました、ありがとうございます

ID:OJxTeQy90

0154 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.17] (ﾜｯﾁｮｲ 253f-gzNs) 2024/11/15(金) 14:07:36.28

gradio_tabsにアニメウィスパー追加したら使えてるんだろうか
じゅるるるるるる！じゅるるるるる！と吸い込みまくりだけど

ID:aY3RFaIR0

0155 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.11][芽] (ﾜｯﾁｮｲ 158f-DnxG) 2024/11/15(金) 19:41:22.39

パイプラインだかでつないでほしいね

ID:Ibbr7xbG0

0156 警備員[Lv.18] (ﾜｯﾁｮｲ 454a-/Xjz) 2024/11/15(金) 20:40:17.93

次のSBV2アプデで追加はする予定やけど、gradio_tabsのdataset.pyでのkotoba-tech/kotoba-speech-v1.1とか書いてあるリストにlitagin/anime-whisperを追加すればとりあえずは使えるで

1 ID:7sj5rT8A0

0157 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.19] (ﾜｯﾁｮｲ a3a9-LdP8) 2024/11/15(金) 22:11:43.84

あとはcolab版の環境構築を軽くしてもらえると助かる

ID:t78MINVS0

0158 警備員[Lv.25] (ﾜｯﾁｮｲ 3637-gDrC) 2024/11/17(日) 01:44:00.64

colabマンはしょうもないレス書き込んでる間にバイトすれば3060ぐらい買えるやろ

ID:iqRHbMS80

0159 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.26] (ﾜｯﾁｮｲ ef8f-GiXI) 2024/11/18(月) 17:34:43.53

学習するのに10時間以上掛かってしまうからマルチGPU対応してくれると助かる
今の構造だと難しいのもわかるけど

ID:QDbBalXr0

0160 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.52] (ﾜｯﾁｮｲ 62ff-k8t/) 2024/11/18(月) 23:15:19.91

SBV2って学習素材のサンプリングレートは40000を想定してるのかな？
48000の素材で学習するとブレスに変なエコーみたいなのがかかっちゃう

ID:C8e9HH480

0161 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][芽] (ﾜｯﾁｮｲ 4207-yj3j) 2024/11/18(月) 23:41:21.98

前処理で44.1khzになるはずだから別の問題じゃない？

ID:HFF6DcC/0

0162 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.27] (ﾜｯﾁｮｲ 6291-BZ2z) 2024/11/19(火) 06:32:21.86

学習素材をすべて48kで統一してたけどブレスにエコーがかかったりしなかった。
それよりも素材の癖がよくでてくるから、こだわるなら注意深く厳選したほうがいいとおもう。

ID:UeVIGRfe0

0163 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.52] (ﾜｯﾁｮｲ 62ff-k8t/) 2024/11/19(火) 06:44:14.10

あれー？そうなのか
でも全く同じ素材を40000に変換して同じ設定で学習し直したらエコーみたいなのが消えたんだ
何でそんな事したかというとRVCの方でサンプリングレート設定のとこを敢えて変えると同じ現象が発生して気がついたんや

ID:0IgvD/I40

0164 警備員[Lv.26] (ﾜｯﾁｮｲ 36b1-gDrC) 2024/11/19(火) 10:07:00.38

もしかしたら潜在的な問題かもしれんけど
学習は大抵素材側が原因だから少ない試行回数でソフト側を疑うのはやめような

ID:CZJ8rBdC0

0165 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 36df-BZ2z) 2024/11/19(火) 11:28:49.70

result = subprocess.run(
File "subprocess.py", line 505, in run
File "subprocess.py", line 1144, in communicate
File "codecs.py", line 322, in decode
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8e in position 1134: invalid start byte

初心者の質問なんやけど今まで学習のHuggingFaceのWhisperを使ってなかったから出なかったんやけど使おうおもったら↑でたんやがどうすればええんや？
AIに聞いてshift-jis変えてみたにゃけどダメやったし

1 ID:WN4+bQ/H0(1/2)

0166 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][芽] (ﾜｯﾁｮｲ 42bc-yj3j) 2024/11/19(火) 11:35:11.55

>>165
ffmpeg入れると治るよ

2 ID:2I/W683V0

0167 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.2][新芽] (ﾜｯﾁｮｲ 36df-BZ2z) 2024/11/19(火) 11:57:06.95

>>166
AIに20回ぐらい聞いてもわからんくて困っとったけど初歩的な質問に答えてくれてサンガツや助かるでホンマ

ID:WN4+bQ/H0(2/2)

0168 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.24] (ﾜｯﾁｮｲ 7bbc-yj3j) 2024/11/20(水) 07:50:21.83

VoiceBox的なソフトはこのスレでええんかね？
Style-Bert-VITS2からの変換にも対応予定みたいや
https://aivis-project.com/

1 ID:VXBB3d5f0

0169 警備員[Lv.19] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/20(水) 08:40:43.40

SBV2にめっちゃ大規模プルリク送ってくれる人が作ったらしいで
内部はSBV2や、ただ日本語処理部分とかいろいろ独自改善入っとるらしい
オープンソースやしな：
https://github.com/A...-Project/AivisSpeech

ID:y813xHWg0(1/6)

0170 警備員[Lv.19] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/20(水) 10:26:10.95

現状でもSBV2モデルから手動でいろいろごにょごにょすれば変換して使えるみたいや、やってる人はおる
UIはもちろん日本語読み取得部分とか諸々でSBV2の上位互換やな、まだ学習用UIはないみたいやけど公開予定らしいし

ID:y813xHWg0(2/6)

0171 警備員[Lv.1][新芽] (ﾜｯﾁｮｲ cf7b-hB9O) 2024/11/20(水) 10:55:39.75

>>168
今後マルチGPUマンとcolabマンにはこれ使えって言えば良くなる
ダニが二匹減ったな

1 ID:h1n71NxQ0

0172 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.26] (ﾜｯﾁｮｲ 2fdf-DTC5) 2024/11/20(水) 12:01:51.75

いまパソコン修理中なので自分で試せないんだが
anime-whisper2で喘ぎ声とかチュパ音認識できるってことは、それで文字起こししたデータで学習したら前まで微妙だった喘ぎ声の生成とか結構できちゃう感じなのかしら？

ID:RMIc3R8/0(1/2)

0173 警備員[Lv.20] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/20(水) 12:04:38.85

学習データが自動書き起こしになってて、喘ぎ声の書き起こしがおかしいまま学習させてたりしたらそうやろな

1 ID:y813xHWg0(3/6)

0174 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.26] (ﾜｯﾁｮｲ 2fdf-DTC5) 2024/11/20(水) 12:16:19.23

>>173
今まで使ってたWhisper largeくんやと喘ぎ声とチュパ音はまともに書き起こししてくれないから当然それで学習させても喘ぎ声とかまとも喋ってくれなかったんよ

その感じだと期待できそうだから修理終わるまで糞、溜めて待つぜ

1 ID:RMIc3R8/0(2/2)

0175 警備員[Lv.20] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/20(水) 13:30:23.38

DMMボイス復活したけど名前変えてたり声優二人ほど変わってたりして草
学習元は変わらずやな

ID:y813xHWg0(4/6)

0176 警備員[Lv.21] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/20(水) 15:12:41.72

>>174
チュパ音については事前学習モデルから作っとるから、チュパ音目当てならベースモデルにはこれ使うとええと思うで
https://huggingface....o/litagin/sbv2_chupa

ID:y813xHWg0(5/6)

0177 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.20] (ﾜｯﾁｮｲ a2a9-Vulu) 2024/11/20(水) 19:08:21.22

>>171
学習にはcolabが必要らしい

ID:IyRIbbHF0

0178 警備員[Lv.21] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/20(水) 20:39:14.80

学習はどう頑張ってもGPU使うんやから（会社が学習用サーバー建てん限り）、ローカルグラボでやるかcolabでやるかは確定やろ

ID:y813xHWg0(6/6)

0179 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.28] (ﾜｯﾁｮｲ 7b2b-yj3j) 2024/11/21(木) 07:03:54.66

Python使えるレンタルサーバーサービスは他にもあったやろ

ID:f0Fb4DCD0(1/2)

0180 警備員[Lv.22] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/21(木) 09:38:15.08

せやな、まあ現状でも普通にレンタルサーバー借りれば学習できるしな
ただそれなりの知識が必要やし、公式colabに文句言っとる人たちが自力でそういうことできる気はせん

ID:p09mSg+I0(1/2)

0181 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.29] (ﾜｯﾁｮｲ 7b2b-yj3j) 2024/11/21(木) 09:57:50.78

でも突然バージョンアップして合わないから動きませんを何回か食らうとな
書き換えインストールで済めばいいが競合であっちを立てればこっちが立たずが起こると頭痛が
直して動かしてChatGPTに聞いて直してやってて無料分切れてまた明日とか

ID:f0Fb4DCD0(2/2)

0182 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.39] (ﾜｯﾁｮｲ 5754-nasw) 2024/11/21(木) 17:30:36.93

Aivisなんとか使ってみようかなと思ったけど自作SBV2モデル使うためにはONNXに変換が必要でその機能はまだ実装してないらしいけどできる人はやってるん？

1 ID:eTLsdy610

0183 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.30] (ﾜｯﾁｮｲ ef8f-GiXI) 2024/11/21(木) 18:36:36.57

もうさくらインターネットでもGPUを借りられる時代

ID:dfXeQbHV0

0184 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.8] (ｽｯﾌﾟﾌﾟ Sd02-zlU+) 2024/11/21(木) 19:24:02.93

でも……お高いんでしょ？🥺

ID:Rq5+d/HJd

0185 警備員[Lv.22] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/21(木) 21:28:06.71

>>182
うさんくさい青バッチが丁寧に解説しとるで
https://x.com/ai_hak.../1859505368705212760
onnx変換は前からプルリク来ててSBV2本家にも標準で入れる予定なんやけどサボっててまだdevブランチにしかない

1 ID:p09mSg+I0(2/2)

0186 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.39] (ﾜｯﾁｮｲ 5754-nasw) 2024/11/22(金) 12:48:20.62

>>185
サンガツ
用意できたわ
基本的にSBVのUIで事足りるからいらん気もするけど複数話者モデルでも連続再生できるのはアプデ待ちだったから助かるかな？
発音の区切りとかもちょっと違うんだろうかわからんけど

ID:yZoTi2gf0(1/2)

0187 警備員[Lv.23] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/22(金) 13:25:35.16

英単語そのまま認識できたり、日本語アクセント周りでも辞書や独自ロジック追加したりいろいろ独自の改善はされてるっぽい
SBV2リポとAivisとの関係をどうするかは今議論中や

ID:Th2R+sMV0(1/6)

0188 警備員[Lv.23] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/22(金) 15:46:08.58

たぶんここのスレ民がAivisに故人声優上げまくってて炎上しかけており草、もっとやれ
デフォモデルのAnneliちゃんには何も文句言われないとこみると、DMMボイスしかりやっぱ名前隠すのが正義なんやな

ID:Th2R+sMV0(2/6)

0189 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.29] (ﾜｯﾁｮｲ 7b52-yj3j) 2024/11/22(金) 16:02:28.96

なんで二次じゃないのににじボイスすなんだろ7色ところじゃないだろ

ID:C5myOUey0

0190 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.25] (ﾜｯﾁｮｲ 4335-AMT0) 2024/11/22(金) 16:06:24.06

SBV2に>>156でanime-whisper入れて試してみとるんやけど
どうも結果が怪しいなと思ったら

「こんにちは。今日はいい天気ですね」が
「こんにちは。今日はいい天気でじゅるるるるるーっ！」
みたいに認識不能シチュかなんかか的なハルシネーションが大量に混ざっとった
入力音声の質かどっかパラメーターがダメなんやろか
それともreleaseブランチなのが悪さしとるんか？

2 ID:pXw7pTml0(1/2)

0191 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.40] (ﾜｯﾁｮｲ 5754-nasw) 2024/11/22(金) 16:07:20.57

モデル共有はバカがやらかすから論外だよね

ID:yZoTi2gf0(2/2)

0192 警備員[Lv.23] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/22(金) 16:48:41.80

>>190
草、そこまでなるか？と思って試したら本当にそうやな、さすがに何かミスってそうやから確認するわ

ID:Th2R+sMV0(3/6)

0193 警備員[Lv.23] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/22(金) 16:57:08.05

>>190
あーたぶん原因は初期プロンプトやな、ファインチューニングのときプロンプト入れて学習しとらんかったからたぶん変なことになっとる。
"こんにちは。元気、ですかー？ふふっ、私は……ちゃんと元気だよ！"となっとるところを消して試してみてくれ
まだ微妙に悪影響ある気がするけどだいぶマシになる。バージョンあげのときここちゃんと対応させるわ

ていうか前にもanime-whisper「デモよりSBV2での書き起こしがやたら悪い」ていう人おったな、そのときためさんで適当いってすまんかった

2 ID:Th2R+sMV0(4/6)

0194 警備員[Lv.41] (ﾜｯﾁｮｲ e288-SmH1) 2024/11/22(金) 18:09:33.96

Aivisさすがコンプラみたいな金にならないことは後回しなんだな

ID:froczr2L0(1/3)

0195 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.66] (ﾜｯﾁｮｲ e728-KP+k) 2024/11/22(金) 18:15:46.67

今はもう実名モデルは非表示になってるけど、出所の怪しい匂わせSBV2モデルが大量出品されてたBOOTHのような事態になるのは時間の問題だと思う

ID:u3EP93ka0

0196 警備員[Lv.41] (ﾜｯﾁｮｲ e288-SmH1) 2024/11/22(金) 18:29:33.38

まあ覇権を取るためにはいいんじゃないですかね
イタチごっこでもプロバイダ責任制限法で逃げ続けられるんじゃないの？
利用者側はローカルで生成するだけならノーリスクなのでどんどんやって

ID:froczr2L0(2/3)

0197 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.38] (ﾜｯﾁｮｲ 067c-yj3j) 2024/11/22(金) 18:35:51.81

sbv2で学習初めて今色々試してるんだけど
これもしかして、ゲームの声のハッとかンッ、ンンッとかだけは学習できない？
そればっかり入ってるのエラーが起きたわデータが悪いのかな

1 ID:0QA6nngr0(1/4)

0198 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.102][苗] (ﾜｯﾁｮｲ 0628-TNDx) 2024/11/22(金) 18:37:26.87

故人声優の声学習させていいかなんとか隆法にいたこしてもらうか・・・

ID:0tt26bWL0

0199 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.38] (ﾜｯﾁｮｲ 067c-yj3j) 2024/11/22(金) 18:37:42.56

>>193
今試してるんだけど、もしかして初期プロンプト空白にした方がいいの？

1 ID:0QA6nngr0(2/4)

0200 警備員[Lv.24] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/22(金) 19:04:38.40

>>199
自力でanime-whisperを追加している場合に関してはそう
他のもの（デフォのとか特にOpenAI系の）に関しては初期プロンプト入れてたほうがそれっぽい書き起こしになるので入れたほうがよい

1 ID:Th2R+sMV0(5/6)

0201 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.38] (ﾜｯﾁｮｲ 067c-yj3j) 2024/11/22(金) 19:17:31.52

>>200
なるほど、僕はデフォだからそのままがいいのかな

ID:0QA6nngr0(3/4)

0202 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.21] (ﾜｯﾁｮｲ a2a9-Vulu) 2024/11/22(金) 19:25:15.38

素人の声を使うのはヤだから誰か有名人が上げてくんねぇかな……

ID:tCYr5Pza0

0203 警備員[Lv.24] (ﾜｯﾁｮｲ e74a-yj3j) 2024/11/22(金) 19:27:54.73

>>197
自動書き起こしでできたファイル（Data/モデル名/esd.list）の中見てみた？
そういう短い音声だとろくな書き起こしになってない気するから、手動修正するか、もうちょっとちゃんとセリフ喋ってるのを学習させたほうがええ気するで

1 ID:Th2R+sMV0(6/6)

0204 警備員[Lv.42] (ﾜｯﾁｮｲ e288-SmH1) 2024/11/22(金) 22:32:01.00

Anneli (NSFW).aivmxも消えてる？

ID:froczr2L0(3/3)

0205 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.39] (ﾜｯﾁｮｲ 067c-yj3j) 2024/11/22(金) 22:32:27.25

>>203
そうなんだ、徐々に勉強していきますｗ

ID:0QA6nngr0(4/4)

0206 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.27] (ﾜｯﾁｮｲ 4335-AMT0) 2024/11/22(金) 22:50:14.05

>>193
消したらハルシネーション激減したわサンガツ

ID:pXw7pTml0(2/2)

0207 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.84] (ﾜｯﾁｮｲ 7ba0-KrXD) 2024/11/23(土) 00:29:48.65

今日初めて使ってみたんやがめっちゃ面白くて笑ったわ。なんやこのソフト

ID:qp8g8cse0(1/4)

0208 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.84] (ﾜｯﾁｮｲ 7ba0-KrXD) 2024/11/23(土) 00:31:13.27

共有GPUしかない雑魚ノートPCでやってるから、10分の動画を学習させるのに11時間くらいかかってもうた

ID:qp8g8cse0(2/4)

0209 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.33] (ﾜｯﾁｮｲ 624f-k8t/) 2024/11/23(土) 02:22:52.72

beatrice最新版の学習用webUI上げてくれてる人のお陰で手軽に学習試せた
たくさんあるパラメータの影響がどうなのか分からんからなんとも言えんけど、声質は似るけど喋り方の特徴までは学習しない感じ？
元のキャラクターを再現したい時はapplioの方が精度高くて向いてるっぽいのかなあ

ID:HTakdSuJ0

0210 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.84] (ﾜｯﾁｮｲ 43e9-KrXD) 2024/11/23(土) 02:23:52.63

ベアトリスってなんのキャラや？

ID:aEQTTT260

0211 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.30] (ﾜｯﾁｮｲ 7b52-yj3j) 2024/11/23(土) 04:56:24.78

ベティで検索するのかしら

ID:VrLf31qi0

0212 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.10][芽] (ﾜｯﾁｮｲ a291-lcJz) 2024/11/23(土) 08:23:52.36

beatriceはリアルタイム変換とCPUだけで動くってのがウリで癖の再現は犠牲になってる
頑張ってモノマネしてください

ID:PKIxmuAp0(1/2)

0213 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.84] (ﾜｯﾁｮｲ 7b83-KrXD) 2024/11/23(土) 10:07:24.87

あ、ベア子か。さんがつ

ID:qp8g8cse0(3/4)

0214 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.84] (ﾜｯﾁｮｲ 7b83-KrXD) 2024/11/23(土) 10:08:17.78

ベアトリスって色んなキャラいるからどれのことなのかとw

ID:qp8g8cse0(4/4)

0215 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.10][芽] (ﾜｯﾁｮｲ a291-lcJz) 2024/11/23(土) 14:21:12.61

RVCみたいなボイチェン規格だよ
ただRVCよりかなり軽い
CPUだけで動く

ID:PKIxmuAp0(2/2)

0216 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ bf69-6m00) 2024/11/24(日) 06:34:08.26

rvcで声の抑揚は無理なんか？
多少ならそれなりにいけるっぽいがちょっと高い声出したらすぐかすれてまうわ
ちな1時間の音声データ200エポックで回してる
抑揚以外はまじで完璧なんだけどな・・

1 ID:9xshE3n30

0217 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.10][芽] (ﾜｯﾁｮｲ 9f91-/2C/) 2024/11/24(日) 08:57:52.63

>>216
１時間まったく同じ喋りが続くデータだったらまるで無意味だぞ
高い声出したいなら高い声で喋ってるデータも入ってないと

1 ID:KWpmHYng0

0218 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.41] (ﾜｯﾁｮｲ ff7c-lJYL) 2024/11/24(日) 15:28:47.67

sbv2で学習したのをAIVMXに変換しようとしたけどonnxに変換するのが上手くいかないわｗボイスサンプルは後でつけれるのか？それともsbv2で先出しておいた方がいいのか？
アプデ情報にもあるしaivisの人が使いやすい学習変換を作ってくれるのを待った方がいいか？

1 ID:c+3YGEyv0(1/3)

0219 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.22] (ﾜｯﾁｮｲ 9fa9-F/UR) 2024/11/24(日) 16:22:15.03

>>218
音声ファイルだからSBV2で作っといたほうがいい

1 ID:zIp/lCEn0(1/4)

0220 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.22] (ﾜｯﾁｮｲ 9fa9-F/UR) 2024/11/24(日) 19:19:08.26

スタイルテキストって付けられない？

ID:zIp/lCEn0(2/4)

0221 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][警] (ﾜｯﾁｮｲ ff7c-lJYL) 2024/11/24(日) 20:18:02.84

>>219
そっちで作ったのをaivisで使いたくて意味無いかな？

1 ID:c+3YGEyv0(2/3)

0222 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.23] (ﾜｯﾁｮｲ 9fa9-F/UR) 2024/11/24(日) 20:32:15.64

>>221
AIVM generatorで設定できるよ

1 ID:zIp/lCEn0(3/4)

0223 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4] (ﾜｯﾁｮｲ ff7c-lJYL) 2024/11/24(日) 21:42:07.12

>>222
そうそう、それで試そうと思ったらonnxモデルがいるとかあって、その変換でつまずいちゃってｗ

1 ID:c+3YGEyv0(3/3)

0224 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.23] (ﾜｯﾁｮｲ 9fa9-F/UR) 2024/11/24(日) 22:11:24.60

>>223
colabではdevブランチをクローンすれば出来た

1 ID:zIp/lCEn0(4/4)

0225 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][新芽] (ﾜｯﾁｮｲ bf1a-6m00) 2024/11/25(月) 01:01:16.33

>>217
高い声も入れてるよ
元音声も抽出したやつじゃなくてBGMと効果音ないやつからそのまま持ってきてるから
音質もかなりいいはずなんだけどね
エクスポートするときの周波数とか関係あるのかな？

ID:AKEAQjk20

0226 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][新芽] (ﾜｯﾁｮｲ d75d-S3rH) 2024/11/25(月) 06:26:21.34

anime-whisperで初期プロンプト消すとかなり良くなるな
同人音声のちゅぱとか喘ぎも認識してくれてる
サンキューlitaginニキ

ID:FCILC4VS0

0227 警備員[Lv.196][UR武+8][UR防+17][苗]:0.35372801 (ﾜｯﾁｮｲ bfb0-Zvkk) 2024/11/25(月) 13:51:57.29

RVCが更新再開ってマ？

ID:pyLS2qy10

0228 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 7f02-/2C/) 2024/11/25(月) 17:05:08.76

V3はよ
てかRVCはマシンパワー使い過ぎなんだよ
ボイチェンとしては使いづらいわ

ID:wsy9J5fY0

0229 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.24] (ﾜｯﾁｮｲ 9fa9-F/UR) 2024/11/25(月) 17:25:20.04

weightsを使おう

ID:h/ZZ8ald0

0230 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][新芽] (ﾜｯﾁｮｲ f77c-lJYL) 2024/11/25(月) 19:50:53.02

>>224
クローンとかよくわからなくてｗ
AIと一緒に勉強してみます

ID:gff9OjkM0

0231 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73] (ﾜｯﾁｮｲ b72b-Vw5o) 2024/11/25(月) 23:03:30.78

超高音で掠れるのは実はSVCあるあるなのでデータが悪いとかじゃなさそう
解決方法は知りません

ID:ggLy5lSo0

0232 警備員[Lv.24] (ﾜｯﾁｮｲ 174a-lJYL) 2024/11/26(火) 12:30:33.07

https://github.com/Aivis-Project/aivmlib
SBV2 -> AivisSpeech形式は、これがもうpipで入るらしいからこれ使えばええっぽいで

ID:rpDHAnMC0

0233 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.25] (ﾜｯﾁｮｲ 9fa9-F/UR) 2024/11/27(水) 09:06:33.38

文字起こしってデフォルトでanime-whisperになる？
--use_hf_whisperを書き換えなきゃ駄目？

ID:TdvOuUX/0(1/2)

0234 警備員[Lv.25] (ﾜｯﾁｮｲ 174a-lJYL) 2024/11/27(水) 10:09:31.15

まだ何も変えとらんからデフォではデフォのままやで

ID:eFmCN/Rj0(1/4)

0235 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.25] (ﾜｯﾁｮｲ 9fa9-F/UR) 2024/11/27(水) 11:47:12.26

別口でクローンしなきゃ駄目？

1 ID:TdvOuUX/0(2/2)

0236 警備員[Lv.25] (ﾜｯﾁｮｲ 174a-lJYL) 2024/11/27(水) 12:51:44.92

>>235
今すぐ使いたいなら手動でソースコードの書き換えが必要

ID:eFmCN/Rj0(2/4)

0237 警備員[Lv.25] (ﾜｯﾁｮｲ 174a-lJYL) 2024/11/27(水) 13:02:44.97

https://github.com/Plachtaa/seed-vc
Seed-VCがver1.0になってかなり凄いらしい

ID:eFmCN/Rj0(3/4)

0238 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.31] (ﾜｯﾁｮｲ f742-lJYL) 2024/11/27(水) 13:16:53.71

Seed-VC入れたらもうRVCのモデルとか捨てちゃってもいいかなエポック別に持ちすぎた
短いsampleでStyle別に音声ファイルあれば学習データ持つより良い気がしてきた

ID:Y5g5QMWW0

0239 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.36] (ﾜｯﾁｮｲ 9f22-+GbN) 2024/11/27(水) 19:34:05.17

applioのトレーニングマニュアル読んでたら学習素材は10～30分にしろ、長すぎても精度落ちるぞ、なんて書かれてた
SBV2の学習も長すぎたら逆効果だったりしますか？

ID:G1R4QkU30(1/2)

0240 警備員[Lv.26] (ﾜｯﾁｮｲ 174a-lJYL) 2024/11/27(水) 19:39:53.01

RVCもやけど正解はない
データ量が長いとエポック数も多めに回したほうがちゃんと学習するのに時間が長くなる説もあり、そうするとやたら長いと時間のコスパが悪い
ただRVCは声質一定が望ましいけどSBV2は逆に多くの表現があったほうがええから、（ちゃんとデータの質担保すれば）個人的には多ければ多いだけいいと思ってる

ID:eFmCN/Rj0(4/4)

0241 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.36] (ﾜｯﾁｮｲ 9f22-+GbN) 2024/11/27(水) 20:00:38.76

良かった
applioってバッチサイズの説明も8より4の方が時間かかるけど精度高くなるなんて書かれてて、うせやろ…？それならハイエンドグラボ無意味やん…って思ってた

ID:G1R4QkU30(2/2)

0242 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][新芽] (ﾜｯﾁｮｲ 177d-wRxM) 2024/11/28(木) 23:30:26.24

バッチサイズは出来に関係するのかね少ないとステップ数は増えるけども

1 ID:fcCFuedg0

0243 警備員[Lv.26] (ﾜｯﾁｮｲ 174a-lJYL) 2024/11/29(金) 10:57:30.33

https://huggingface....aces/Plachta/Seed-VC
Seed-VCの気軽に試せるデモ
ゼロショットでボイチェンここまで再現できるのすげえ

ID:JbkhF70U0

0244 警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 7f91-6m00) 2024/11/29(金) 12:21:57.67

音声データって長ければ長いほどエポック数少ない方がいいの？
1時間の音声データだったら100エポックくらいか？

1 ID:mD+5UtPT0

0245 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.26] (ﾜｯﾁｮｲ 9fa9-F/UR) 2024/11/29(金) 19:47:56.15

anime-whisperってタイムスタンプ付けれない？

1 ID:N/UGkXym0

0246 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.11][芽] (ﾜｯﾁｮｲ 9f91-/2C/) 2024/11/29(金) 19:57:30.41

>>244
少ないほうがいい、とまではいかない
ただ、RVCでの例であれば、１時間程度の質の良いデータセットが揃っていれば、５０～１００エポック程度でもそこそこ高い再現度になってくれる、こともある

1 ID:TWwSHRSL0

0247 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][芽] (ﾜｯﾁｮｲ bf1d-6m00) 2024/11/29(金) 22:21:32.50

>>246
サンクス
とりま150くらいで回してみるわ

ID:Lco2vQH90

0248 警備員[Lv.9][芽] (ﾜｯﾁｮｲ 1e49-Dj8N) 2024/12/01(日) 13:49:00.57

>>242
RVCもLORAもバッチサイズは下げた方が最終的な質は良くなるってのが定説やなあ
その違いがはっきり判るレベルなのかどうかは別として

ID:+KaECmyF0

0249 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.37] (ﾜｯﾁｮｲ 8ca4-jCUt) 2024/12/01(日) 14:07:48.58

>>245
これ俺も知りたい

ID:Z/Zvk/ws0

0250 警備員[Lv.26] (ﾜｯﾁｮｲ 0e4a-zF9U) 2024/12/01(日) 14:43:02.83

anime-whisperのタイムスタンプ、デフォのtransformersライブラリやOpenAIのライブラリのやつでは無理や
一応タイムスタンプ返す設定はできるが、ザルすぎるしハルシネが増加する
30秒未満の場合は
https://github.com/l.../whisper-timestamped
を組み合わせればわりとできる

ID:53C8B3Tm0(1/3)

0251 警備員[Lv.26] (ﾜｯﾁｮｲ 0e4a-zF9U) 2024/12/01(日) 14:43:51.48

某discordでも、SBV2はバッチサイズ下げたほうがなんとなく質が良いという立場の人はまあまあおるな
あとデフォの学習率は高すぎ説はあって、それは確かにそうなんかも知らんと最近思い始めとる

ID:53C8B3Tm0(2/3)

0252 警備員[Lv.27] (ﾜｯﾁｮｲ 0e4a-zF9U) 2024/12/01(日) 15:43:53.13

音声入れると似た声のエロゲキャラを検索してくれるやつ作った
学習元ネタ特定にも役立つ（？）
https://huggingface....galgame-voice-finder

2 ID:53C8B3Tm0(3/3)

0253 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.69][SSR武][SR防] (ﾜｯﾁｮｲ 247b-NijZ) 2024/12/01(日) 23:08:01.50

>>252
やってみたけど確かに声質似てるの検索できるわすごE
ギャルゲーの範疇ならかわいいもんだけどデータセット規模がデカくなったら声優の表/裏の境界を消し飛ばす闇の技術になりそうだ

ID:a3EVLxF90

0254 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.9] (ﾜｯﾁｮｲ fe7c-Dngz) 2024/12/01(日) 23:53:55.30

Aモデルからヌルマージモデル使ってささやきモデルを作ったのですが
これをAモデルに「ささやき」てスタイルで追加する方法を教えてください

ID:Gia5fv+40

0255 警備員[Lv.27] (ﾜｯﾁｮｲ 0e4a-Q86W) 2024/12/02(月) 09:45:09.42

むりです

ID:GIYo1BPa0(1/2)

0256 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.40] (ﾜｯﾁｮｲ 9f54-fW9x) 2024/12/02(月) 10:19:48.29

すごいなこれ
裏名義で違う演じ方してるのでも当ててくるわ

ID:yJ+rFn7B0

0257 警備員[Lv.27] (ﾜｯﾁｮｲ 0e4a-Q86W) 2024/12/02(月) 10:30:43.09

にじボイスやAivisのサンプルボイス突っ込むと絶対これだろって学習元が出てきておもろいで

ID:GIYo1BPa0(2/2)

0258 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][芽] (ﾜｯﾁｮｲ f691-Dj8N) 2024/12/03(火) 01:04:13.23

sbvはステレオ音声でも正常に学習できるのだろうか？🤔

ID:gLgYiyg80

0259 警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 0e4a-Q86W) 2024/12/03(火) 11:24:09.68

たぶん自動的にモノラルに変換されてから学習される

ID:oQWPvnqw0

0260 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.25] (ﾜｯﾁｮｲ 877c-Q86W) 2024/12/05(木) 00:12:56.15

にじボイスはもうだめだ、俺達にはsbv2しかねえ

ID:QSGxo+El0

0261 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.70][SSR武][SR防] (ﾜｯﾁｮｲ 247b-NijZ) 2024/12/05(木) 02:01:12.29

なんかあったんか？
SBV2でだいぶ満足してるからまったくさわってねンだわ

ID:PenHcY4U0

0262 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ b831-EYge) 2024/12/05(木) 06:46:20.45

ダメじゃないし、波形の類似性で違法を認める法案でも通らん限り安泰やで

ID:vTAsrMPd0

0263 警備員[Lv.1][新芽] (ｽﾌﾟﾌﾟ Sd02-a9+H) 2024/12/05(木) 10:48:40.10

>>252
面白そう

ID:bUQ7Ny4ld

0264 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ f681-Dngz) 2024/12/06(金) 13:18:25.79

やってる人いたら教えてほしいんだけどbeatriceの学習が
\beatrice_trainerl__main__.py", line 3374, in ‹module>
batch = next(data_iter)
で全く進まないんだけど何か情報ある？
調べたら同じ箇所で詰まってる人はいたが解決策は見当たらなかった

ID:3/w3DQ9N0

0265 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.11][芽] (ﾜｯﾁｮｲ f691-Dj8N) 2024/12/06(金) 14:13:21.48

sbv2で,いくつかモデルを生成してみたけど,学習時にloss値の変動が激しいのが気になった。
200ステップおきでも上下に動きまくってるし,多様な素材でやってもその傾向は変わらず。

ID:JwCvMxfA0

0266 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.30] (ﾜｯﾁｮｲ bea9-sdFG) 2024/12/06(金) 18:52:46.46

韓国語の読み上げAIも欲しいな

ID:TACaIrqZ0

0267 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.32] (ﾜｯﾁｮｲ 877c-Q86W) 2024/12/07(土) 08:37:18.27

にじボイスは高すぎる月1000円で使い放題にしてくれ

ID:PUkcKQzt0

0268 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.16] (ﾜｯﾁｮｲ fe4b-Q86W) 2024/12/07(土) 09:26:16.09

文字数歩合制料金は悪手やろな

ID:a3BxrmC20

0269 警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 67f5-/SJv) 2024/12/08(日) 19:01:07.60

今のところエロTTSはSVB2.で学習が安牌？

ID:/xsERk3k0

0270 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.17] (ﾜｯﾁｮｲ 677b-N88W) 2024/12/09(月) 15:23:42.38

にじボイスはこれがなあ
https://note.com/1230yuji

ID:KnmDrHdO0

0271 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][新芽] (ﾜｯﾁｮｲ 4755-7Ydj) 2024/12/09(月) 20:37:34.16

DMM系のエロゲってTextractorで文章抜ける？ゲームによるんだろうけど、どうやって書き起こせばいいのか悩んでる…whisperにも限界はあるし

2 ID:SwX2x3nl0(1/2)

0272 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][新芽] (ﾜｯﾁｮｲ 4755-7Ydj) 2024/12/09(月) 20:39:48.88

ちなみに言うと半年ぶりにやる気出て覗きに来たやで
今からちまちま過去ログ読むわ

ID:SwX2x3nl0(2/2)

0273 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ df03-N88W) 2024/12/10(火) 12:51:48.91

>>271
GARbroは試した？
github.com/crskycode/GARbro
テキスト抽出は一度GARbroで解凍したファイルを手動パースになりがちやけど
あとはまあanime-whisper

ID:s/n3Gjey0

0274 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.40] (ﾜｯﾁｮｲ a754-t9CO) 2024/12/11(水) 12:20:06.81

ブラウザゲーは通信を覗く系使ったほうが元データ拾えるんじゃね
よく知らんけど

1 ID:sQMlqkDU0

0275 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.19] (ﾜｯﾁｮｲ 677b-N88W) 2024/12/13(金) 17:20:25.76

Xににじボイスでウッキウキなおっさんの意見が沢山上がっとるわ
興味をもって調べる→自分で作るって流れにはならんようだな

>>274
DMMプレイヤー不要のブラウザゲーなら合ってる
サ終前のスレに通信からリッピングするスクリプト置いてく人とかいる

ID:2MwDXe6h0

0276 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.7][芽] (ﾜｯﾁｮｲ 8747-lhhN) 2024/12/13(金) 18:41:57.18

にじボイス、すごく良いね！
自分でも色々調べてみたけど、やっぱりあのスピードは自宅サーバじゃ難しいかな。
うちのGPUが1050tiだから、ちょっと時間かかっちゃって…。
Runpodもちょっと試してみたんだけど、使うたびに数ドルずつ減っちゃうから、なかなか続けるのが難しい感じなんだよね。

ID:LJQBR6B50(1/2)

0277 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.8][芽] (ﾜｯﾁｮｲ 8747-lhhN) 2024/12/13(金) 19:21:00.27

276です。誤解のないように捕捉するけど、割とここは私より若い人が多いから
chatgptでフィルターをかけました。とげのない文章にしたかっただけなんだけど
後から読んだらAI丸出しですね

ID:LJQBR6B50(2/2)

0278 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.12][芽] (ﾜｯﾁｮｲ df91-Xc+v) 2024/12/14(土) 10:10:06.08

普通の書き込みやん
逆にAIと向き合いすぎて色んな書き込みをAI認定しそうで怖いわ

ID:ThmslwY+0(1/2)

0279 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][新芽] (ﾜｯﾁｮｲ 277d-Kulz) 2024/12/14(土) 10:16:04.84

反応がないからAIが書いたことにして誤魔化したと解析AIが言ってた

ID:UKfXU+rs0(1/2)

0280 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][新芽] (ﾜｯﾁｮｲ 277d-Kulz) 2024/12/14(土) 10:17:29.28

chatgptはこの文章はあなたが書いたもの？ときと答えてくれてそうじゃないときの可能性も教えてくれる

ID:UKfXU+rs0(2/2)

0281 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.13] (ﾜｯﾁｮｲ df91-Xc+v) 2024/12/14(土) 17:47:25.06

対面の会話ですら、ARグラスに映し出されたカンペを読みながらAI音声で会話をする、という未来がありそうだな

ID:ThmslwY+0(2/2)

0282 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 8fdd-3k2I) 2024/12/15(日) 21:00:10.07

>>271です
ブラウザで起動して音声データは抜けたんだけどなぜかそのフォルダ内にテキストデータがないんだよね…どこかに一括で格納されてるのかな？探してもないからとりあえずAnime-whisperでいいや

ID:S7TF41Kv0

0283 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ a3d0-SaU4) 2024/12/15(日) 23:32:05.56

>>166
今同じ状況なんだけどffmpeg入れて何やればいいの？

1 ID:DhEr5q7r0

0284 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 4a4f-SaU4) 2024/12/16(月) 00:05:31.07

>>283
ffmpeg入れてパスを通すだけ

1 ID:xwP+Rd2o0

0285 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.3][新芽] (ﾜｯﾁｮｲ 8f4a-SaU4) 2024/12/16(月) 00:22:10.57

>>284
解決しました。無知でスミマセン

ID:odHBTeq00

0286 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][SSR武][SR防] (ﾜｯﾁｮｲ 1f7b-lROp) 2024/12/20(金) 14:47:20.45

テステス
このスレ生きてるんか？

ID:rBhQgDwd0

0287 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][芽] (ﾜｯﾁｮｲ 23a6-SaU4) 2024/12/20(金) 17:52:19.85

生きてるよ。熱心な人はディスコ行ってるけど

ID:BPaZzcGq0

0288 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.73][SSR武][SR防] (ﾜｯﾁｮｲ 1f7b-lROp) 2024/12/21(土) 22:22:31.68

なんJRVC部のDiscord招待しんでて入れんわ
AI声づくり技術研究会のほうか?

ID:uL2UuEka0

0289 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][芽] (ﾜｯﾁｮｲ 23a6-SaU4) 2024/12/21(土) 22:50:24.54

> AI声づくり技術研究会のほうか?
そうそっち。SBV2の人とかSeed-vcの人とかおるよ

ID:dGEHWVH40

0290 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.23] (ﾜｯﾁｮｲ b15b-q1xP) 2024/12/23(月) 11:55:22.53

好みの声優の声でASMR作りたいのですが方法としては
・RVC…既存のASMR作品をもとに変換
・SBV2…自分でテキスト入力して作成する
って認識でいいですか？
あとオススメはどちらか教えてください

1 ID:m5qTEAQr0(1/2)

0291 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.28] (ﾜｯﾁｮｲ 4bdb-q1xP) 2024/12/23(月) 12:56:01.20

>>290
ASMR側を15秒くらいにカットして
声優サンプルは3分ぐらいで試してね
https://huggingface....aces/Plachta/Seed-VC

1 ID:Np1Fy3tn0

0292 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.23] (ﾜｯﾁｮｲ b15b-q1xP) 2024/12/23(月) 13:37:36.55

>>291
ありがとうございます。試してみたらいい感じに変換してくれました

ID:m5qTEAQr0(2/2)

0293 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.29] (ﾜｯﾁｮｲ 0e8d-apTP) 2025/01/01(水) 21:41:41.64

仮性包茎おちんぽLoRAってなかったっけと思ったけど
そういやモザイク必要なんやったわ

ID:yb8RKsrr0

0294 警備員[Lv.5][芽] (ﾜｯﾁｮｲ 334a-Udw9) 2025/01/02(木) 16:55:32.64

せやな

ID:D8Vv0hO50

0295 警備員[Lv.27] (ﾜｯﾁｮｲ 4b8b-3Bd7) 2025/01/11(土) 15:16:13.80

知らん間にapplioのモデル直ダウンロードが潰されてんな

ID:nZVUXy5m0

0296 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][新芽] (ﾜｯﾁｮｲ 111e-TMyh) 2025/01/11(土) 22:25:45.94

どうなるか分からんねえ
シートベルト緩めてた
横転したら
たぶん惰性であとは成績次第

ID:ja05+3DT0

0297 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.10][芽] (ﾜｯﾁｮｲ be82-VqcK) 2025/01/12(日) 00:17:46.08

朝寒いの別に全然あり得たからな
どう争うの

ID:r/SiThE20

0298 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.77][SR武][SR防] (ﾜｯﾁｮｲ 597b-U3nF) 2025/01/12(日) 04:09:13.59

久しぶりに学習させようと思って音声作品漁ったけど
まずキャラクターにあう声見つけるの難C
そしてR18ボイスはすぐﾁｭﾊﾟﾁｭﾊﾟｼﾞｭﾎﾟｼﾞｭﾎﾟしやがってまともに喋ってんの冒頭の1分くらいで全然ダメだわ
全年齢……全年齢しか勝たん(あと催眠音声)

1 ID:/cnhJG3p0

0299 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.81][SR武][R防] (ﾜｯﾁｮｲ a554-fuva) 2025/01/13(月) 10:06:59.66

silly tavern用にTTS始めようと思ってここに辿り着いたんだけど
一つのモデルで普通の声とオホ声を使い分けるのって難しいの？
ググってもCOEIROINKのクロワちゃんしか出てこないんだけど、クロワちゃんはずっとオホ声で喋り続けるんだよな

1 ID:uFtHnLl70

0300 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.11][芽] (ﾜｯﾁｮｲ ca4b-eOGw) 2025/01/13(月) 22:17:27.72

現状ではないが、これからも成績良かったけどな
ほぼほぼ完全に完成してカッコ良かったけど

ID:OTRtWCZ20

0301 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][芽] (ﾜｯﾁｮｲ c6c5-VSeE) 2025/01/13(月) 22:36:45.38

いてわてせふそあはりれいぬかねせうやむおへらせにこせつをろせなそすらすうぬこまきね

ID:CWdPmS350

0302 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][芽] (ﾜｯﾁｮｲ 6ade-uTLw) 2025/01/13(月) 22:56:21.16

>>299
スタイル分け使えば可能だと思うよ
st側で自動スタイル切り替えはしてくれないからそういうシーンになったら主導で切り替える必要はあるけど

1 ID:3Tnv3PcN0

0303 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.8][芽] (JP 0H91-Te2l) 2025/01/13(月) 23:46:00.05

そもそもモリカケの件メンバー会議みたいな部屋に大きな影響力あるんかこいつ
ダブスコ売ったのに負けて

ID:9qUAPYtqH

0304 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.19] (ﾜｯﾁｮｲ c19a-yNlY) 2025/01/14(火) 00:11:31.25

そしてバドホがこんな面白いのに、超とんでもねえこと言ってんじゃん
きちんと対処しましょう
https://i.imgur.com/tVaWxLg.png

ID:s8H+5NRe0

0305 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][新芽] (ﾜｯﾁｮｲ ca88-N98J) 2025/01/14(火) 00:35:02.28

今でも言われてるみたいだけか

ID:5cW78Xwt0

0306 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.12][芽] (ﾜｯﾁｮｲ a90c-jeph) 2025/01/14(火) 00:51:00.90

企画に組織票と資金集めの頃はマジで頭大丈夫か？洗脳されてんの？
Key「うおおおお我が社の全世界累計ワールドワイド売上バトルにも配慮が至らなかったことも暴露されたあいHD<3076>、
評価してるし、学力もエリートだからフィギュアスケート以外でも知名度もイマイチだから1人で取り囲んで実演させたりしたんだけど

ID:rz0jyHUo0(1/2)

0307 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.7][芽] (ﾜｯﾁｮｲ a90c-n52R) 2025/01/14(火) 01:16:55.41

あと
5キロはいきたい
最近
いきなりコロナなる

ID:rz0jyHUo0(2/2)

0308 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.8] (JP 0Hfa-eOGw) 2025/01/14(火) 01:18:48.76

>>85
議席と票に見合う金額だったという風潮
アホやな
まさしく同感だ

ID:0vxHCx6XH

0309 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.16] (ﾜｯﾁｮｲ d690-T9QO) 2025/01/14(火) 01:19:54.29

#GASYLE七不思議

ID:HS29Y4ND0

0310 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.8] (ﾜｯﾁｮｲ 2548-zBlA) 2025/01/14(火) 02:25:06.56

重複してもいるが
めちゃくちゃ小便でるな

ID:bwXFQctA0

0311 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][芽警] (ﾜｯﾁｮｲ 2529-yNlY) 2025/01/14(火) 02:41:15.65

職業　生涯　運転手が怪我して推せるのは

ID:uh+hZTBT0

0312 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.82][SR武][R防] (ﾜｯﾁｮｲ a554-fuva) 2025/01/14(火) 03:54:50.29

>>302
使い分ければ出来るけど1モデルじゃ出来ないのか
ありがとう

ID:xZVcK0030

0313 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.35] (ﾜｯﾁｮｲ 0aa9-GJqv) 2025/01/14(火) 08:48:47.42

Aivisspeechは詰め込まずに適宜必要なやつだけ入れた方がいいんかね

ID:w9tefqUv0

0314 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.53] (ﾜｯﾁｮｲ 4a47-0c4Z) 2025/01/15(水) 08:47:14.69

スタイル分けしてもたまにオホ声が混ざるから
2つモデル作った方が綺麗に喋るかもしれん

ID:pgS5aJJ30

0315 警備員[Lv.6][芽] (ﾜｯﾁｮｲ dd4a-uTLw) 2025/01/15(水) 12:46:59.00

>>298
エロゲ漁るのもええで
1キャラたいてい3時間以上あるしエロ除いても1時間以上は確実に確保できる

ID:FJBuhkM+0

0316 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.27] (ﾜｯﾁｮｲ 4a28-P7S3) 2025/01/15(水) 14:12:12.53

ゲームの素材は音質良いしきっちり前処理されてるしほんと最強

ID:22CLIyZC0

0317 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.2][新芽] (ﾜｯﾁｮｲ dd55-6jMg) 2025/01/15(水) 16:05:37.55

anime-whisperをブラウザからのダウンロード経由で導入する方法ってないやろか？
ワイの環境やとdataset.pyの書き換えやとモデルダウンロードに失敗して中断されちゃうわ
色々試してるんやけどどこに置けばええんかそもそも認識されるんかすらわからんが・・・

ID:DPP2bL+50

0318 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.3][新芽] (ﾜｯﾁｮｲ 868f-oPwI) 2025/01/15(水) 20:43:00.94

hf_hub_download()じゃだめなの？

1 ID:DWdmQwU80

0319 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.36] (ﾜｯﾁｮｲ 0aa9-GJqv) 2025/01/16(木) 07:06:16.59

SBV2で書き起こし出来なくなった

1 ID:qSYiTrNh0

0320 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.1][新芽] (ﾜｯﾁｮｲ 4155-6jMg) 2025/01/16(木) 14:47:44.25

>>318
dataset.pyの書き換えじゃなけりゃダウンロード出来るんやけど
ファイルをどこに置けば適用されるのかわからんくてな・・・

ID:g9Xs0+TH0

0321 警備員[Lv.28] (ﾜｯﾁｮｲ d65e-fuva) 2025/01/16(木) 15:58:19.69

>>319
ここはお前の日記帳

ID:u1JiuzDX0

0322 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][新芽] (ﾜｯﾁｮｲ 7ac5-pCI4) 2025/01/17(金) 18:33:21.31

winPythonとPortable 版 Gitを使ってseed-vcを入れることは可能なんやろか
持ち運びして運用したいがWinPythonが調べてもよく分からん

ID:NW8Nk6vl0

0323 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.2][新芽] (ｵｯﾍﾟｹ Src7-pJ9J) 2025/01/22(水) 20:46:21.08

実質VC総合スレみたいになってるな
勢い死んでるけど

ID:MalJ/FZFr

0324 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.42] (ﾜｯﾁｮｲ 6354-1Qd2) 2025/01/23(木) 13:43:22.94

日本語はいまいちだけどhailuoって動画生成メインのAIが出してきた音声サービスもなかなか凄いな
英語なら完璧だわ

ID:J5mwiIe90

0325 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.78][SR武][SR防] (ﾜｯﾁｮｲ 737b-rbLX) 2025/01/23(木) 23:53:07.21

Style-Bert-VITS2 雰囲気でマージしまくってると指数関数的にスタイル数が爆増してくな
スタイル一覧のテキストが100万字とかになってきてSillyTavernのUIがしぬほど重くなってきた

ID:4VWfhqCD0

0326 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.9][芽] (ﾜｯﾁｮｲ 6f32-Jbvc) 2025/01/25(土) 11:57:51.66

ＲＶＣでボイスチェンジャー作ったんやが
indexの項目あげたら音声出力ないんやが
なんでや？

ID:L1YJrt4d0

0327 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][新芽] (ﾜｯﾁｮｲ a37d-jwSl) 2025/01/25(土) 13:12:39.65

ボイチェン作るときに作り忘れたんじゃないか？

1 ID:aZlGM0Fy0

0328 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.6][芽] (ﾜｯﾁｮｲ cf28-MrFm) 2025/01/25(土) 13:22:13.34

>>327
indexのフォルダが間違ってたわ
普通に解決した

ID:n5gtP10e0

0329 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.26] (ﾜｯﾁｮｲ 3b7b-N+ua) 2025/01/28(火) 19:47:49.21

去年の5月ぶりに来たんやけど今一番熱いTTS教えてクレメンス
まだStyle-Bert-VITS2でええやろか

1 ID:ptItKcF70

0330 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.4][芽] (ﾜｯﾁｮｲ 767b-N+ua) 2025/01/28(火) 21:06:15.56

RTX50x0台ってRVC的にどんな感じですか。初挑戦してみたい5090の価格はきついけど。

ID:hxVjDZpg0

0331 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.23] (ﾜｯﾁｮｲ ca7d-Tb/A) 2025/01/29(水) 22:05:00.22

illustriusで油絵っぽいの生成したいんだけどどんなプロンプトがあるんかな
今試してるのはoil painting, oilpaint style, traditional media, なんだけど多少色が濃くなってタッチが粗くなるくらいであまり効果を感じない
まさか絵師タグでレンブラントとか学習してるとも思えないし・・・

1 ID:MgKfuo5C0

0332 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.5][芽] (ﾜｯﾁｮｲ 8ba6-N+ua) 2025/01/29(水) 22:43:21.10

ダンボールにはoil_painting_(medium) というタグがあるがどうか
というかダンボールは日本語でも検索できるから存在すれば何でもすぐ見つかるぞ

ID:zEwcT6vc0

0333 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.17] (ﾜｯﾁｮｲ b625-W7nG) 2025/01/30(木) 19:47:37.35

>>331
誤爆しおってこやつめ(*ﾟ∀ﾟ)σ)∀`)ﾌﾟﾆ♪

ID:QX5CgXM10

0334 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.3][新芽] (ﾜｯﾁｮｲ f63e-3KDQ) 2025/01/31(金) 06:14:00.36

ささやき特化のTTS学習済みモデル「NiteBuzz」無料配布開始やでｗ
しっかしみんなGPT-SoVITS使ってんのかねえ
URL貼れないからboothで探してね

ID:2cFhmBRV0

0335 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.80][SR武][SR防] (ﾜｯﾁｮｲ 0f7b-fK0e) 2025/02/03(月) 11:49:50.92

>>329
Tsukasa-TTSとかかな
英語も含めるとKokoro-TTSとかだと思う
huggingfaceではHKUSTAudio/Llasa-3Bがトレンド入ってるけどこれはエアプなんでしらん

ID:qKOxMjHd0

0336 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった警備員[Lv.8][芽] (ﾜｯﾁｮｲ 4fa6-awfr) 2025/02/08(土) 08:33:06.80

Seed-VC、Windows10でgit cloneしてPython3.10入れてvenvをactivateしてからpip install -r requirements.txt(cuda12.4に併せてwhl/cu124に書き換え)したんだけど
app.pyでの音声変換は出来たんだけど、real-time-gui.pyでリアルタイム変換しようとマイクで喋っても変換後の音声がしゃっくり見たいな音しか出ない
今でもちゃんとリアルタイム変換ってできるんでしょうか？

ID:sSDzTiHW0

なんでも実況U

なんJRVC部★9

スレッド一覧

メニュー

返信

書き込み

書き込み

ＵＰＬＩＦＴにログイン

なんでも実況U

なんJRVC部★9

トップページ

なんJRVC部★9

スレッド一覧

メニュー

返信

書き込み

書き込み

ＵＰＬＩＦＴにログイン

トップページ