<youtube-transcription-player>
WEBVTT Kind: captions Language: ja 00:00:00.320 --> 00:00:04.700 こんにちは motemen です 今日は作ったものについてご紹介しようと 00:00:04.700 --> 00:00:08.920 思います まず課題意識としてこんなことありませ 00:00:08.920 --> 00:00:13.920 んかって書いてるんですが 最近はリモートワークで仕事をする人も 00:00:13.920 --> 00:00:20.700 増えてきてリモート会議であったりリモートの ミーティングのツールを使って人前で話を 00:00:20.700 --> 00:00:26.490 するっていうことをする機会も増えてきた んじゃないかなと思いますそういうときにです 00:00:26.490 --> 00:00:32.470 ねこういうこともよくあるかなぁと思って いて参加者がカメラオフにしていたりまた 00:00:32.470 --> 00:00:37.210 モニター越しだと聞いてくれている人 とは視線が合わない目線が合わないという 00:00:37.210 --> 00:00:41.440 こととか ありますとそうなるとですね話している側 00:00:41.440 --> 00:00:47.050 としてはけっこう身に覚えがあるんじゃないかな と思うんですが相手の反応がわからない 00:00:47.050 --> 00:00:52.030 はい自分の言ってること伝わっているのかな とかこれ聞こえているかなみたいなような不安 00:00:52.030 --> 00:00:56.960 になっちゃう喋りにくいってことがあるん じゃないかなと思うんですね 00:00:56.960 --> 00:01:02.809 そこで作ったのが vnodroid と 呼んででますがこういうものですまさに今 00:01:02.809 --> 00:01:08.290 画面の左側に出てるんですけど バーチャルうなずき人間ということでこういう 00:01:08.290 --> 00:01:11.860 名前にしてします 機能としてはまあこっちの話を聞いて 00:01:11.860 --> 00:01:16.540 くれるというだけにつきまして まず1つは適当なタイミングで頷いて 00:01:16.540 --> 00:01:22.340 くれる適当というか適切なタイミングですね あとモニターみるといつでも視線がある 00:01:22.340 --> 00:01:28.250 目を見てくれるということですねはい えっとこれはウェブサイトにアクセスすると 00:01:28.250 --> 00:01:33.470 すぐに使い始めることができます motemen.github.io/vnodroid/ に 00:01:33.470 --> 00:01:38.170 アクセスでカメラとマイクを許可してあと はおもむろにしゃべり始めたら ok です 00:01:38.170 --> 00:01:44.030 ここえっといくつか VRoid Hub と いうサイトで配布されているものを使って 00:01:44.030 --> 00:01:46.310 まして いくつか 00:01:46.310 --> 00:01:50.780 デフォルトでサンプルモデルとして提供さ れている物を使うことができるので 00:01:50.780 --> 00:01:53.800 3種類のキャラクターから選ぶことができます 00:01:53.800 --> 00:02:00.250 技術的には VRM っていう 3Dアバター 00:02:00.250 --> 00:02:04.230 のための規格 ですかねモデルファイルをブラウザ上で 00:02:04.230 --> 00:02:09.750 表示できる three-vrm というのを使って いて使っておりましたあとですね 00:02:09.750 --> 00:02:13.230 その聞き取りうなずきのタイミングを確定 するために Web Speech API 00:02:13.230 --> 00:02:17.120 というものを利用しています Web Speech API の中でも 00:02:17.120 --> 00:02:21.110 この聞き取りを行う例えば Chrome だと webkitSpeechRecognition 00:02:21.110 --> 00:02:26.780 っていう名前なんですがこれを使っ ていてこれを使うとですねマイク入力をリアル 00:02:26.780 --> 00:02:30.980 タイムに今コンソールだしてますけど文字列として聞き取ることができると 00:02:30.980 --> 00:02:35.390 でリアルタイムに聞き取るんですけど途中で ですねあの 00:02:35.390 --> 00:02:39.590 聞き取りの内容を確定されるタイ ミングってのがあるんですね 00:02:39.590 --> 00:02:43.850 まあやっとそうなると意味が確定したん だろうということで頷きのタイミングにし 00:02:43.850 --> 00:02:47.890 ています だけどあまりに長すぎると 00:02:47.890 --> 00:02:53.110 なかなか意味が確定しないということで気 聞き取り内容が確定しないということで話の途中 00:02:53.110 --> 00:02:58.950 でも時々今が開いたらうなずきを入れる みたいな感じで調整してますこの辺は 00:02:58.950 --> 00:03:02.430 自然になるように調整していくのはまあ これからやっていきたいなということです 00:03:02.430 --> 00:03:06.660 ねはいじゃあ motemen.github.io/vnodroid/ にアクセスしていただければ皆 00:03:06.660 --> 00:03:11.750 さん今日から無料で使い始められますので どうぞご利用ください