Categories
Japanese Blog

VoicePingがJ-StarX Silicon Valley Extended Programに参加しました!

こんにちは、VoicePing CTOの山田 大稀です。

VoicePingが500 globalとJETROによって開催されたJ-StarX Silicon Valley Extended Programの最終審査に通過し、10月28日から11月22日までシリコンバレーで実施される現地プログラムへ参加しました。

まず、簡単にプログラムの内容を説明すると、プレシードからシリーズAの海外進出を考えているスタートアップが参加するプログラムとなっており、全部でPhase1~3まで用意されています。Phase1ではICP (Ideal Customer Profile)やGo-to-marketなどのマーケティング戦略や効果的なピッチのやり方などを2週間かけて学びます。その後、各社ピッチを実施し、その中で選ばれた15社がPhase2へと進みます。Phase2ではグローバルなメンターたちと相談しながら、北米進出への戦略的な計画を設計します。こちらも2週間のプログラムが用意されています。Phase3では約1ヶ月間シリコンバレーへ訪問し、Phase2で立てた計画をもとに北米進出への足掛かりを作ることが目的です。また、Phase3でもいくつかのプログラムが用意されていますが、基本的には各社それぞれが行動し、資金調達や北米での顧客獲得など各々の目的を果たす内容となっております。

 

このプログラムで参加したイベントや幾つか有名企業の本社に訪問できる機会がありましたので、一部共有します。また、弊社CEOの中島がPhase1についてのブログを書いていますので、気になる方はご覧ください。https://medium.com/@atyenoria/insights-from-500-globals-j-starx-program-on-nsm-pmf-and-pitching-to-vcs-fd332776f63b

 

簡単に私の自己紹介ですが、私は1年半以上VoicePingでフルスタックエンジニアとして働いており、VoicePingのWebアプリのフロントエンド・バックエンドの開発やSpeech-To-TextのAIモデルを作成するなどVoicePingの機能全般に関わらさせていただいています。社員は現在8名おり、全員がコードを書けるエンジニアというなかなか珍しい環境で、切磋琢磨して日々成長できる環境で働くことができています。

現在、VoicePingではAIエンジニア・Web開発エンジニアを募集しています。最先端の言語モデルを扱いたい方、高性能音声認識や翻訳モデルを作りたい方、複雑でハイパフォーマンスなWeb開発アプリケーションの設計・開発・運用をしたい方は、お気軽にご相談ください。

TechCrunch Disrupt 2024

10月28日から10月30日にかけて、サンフランシスコで開催されたTechCrunch Disrupt 2024に参加しました。TechCrunch Disrupt 2024とは10,000人以上の参加者を有し、かつその内の約50%がスタートアップ企業であり、また約1,200人の投資家が集まるなど、スタートアップ企業と投資家にとって次の新しいイノベーションを発見する大規模なTechイベントです。TechCrunchについては別でブログを書いたので、ご覧ください。https://voice-ping.com/blog/ja-blog-techcrunch-disrupt/

Meta本社

11月4日に弊社社員の友人がMetaでエンジニアをしていることから、Metaオフィスのツアーを実施していただきました。彼はMetaで5年間ソフトウェアエンジニアとして働いており、Oculus QuestのOS開発をメインに担当しています。Meta本社に入った時にオフィスを見てとても驚きました。なぜならオフィスではなく1つの街だったからです。たくさんのレストランやカフェ、無料で修理できるバイクショップ、床屋、スポーツセンターなどオフィスだけで生活できる物が全て揃っている印象を受けました。レストランに関してもインド料理やラーメン、ハンバーガー、アイスクリームなど様々な文化を取り入れているようでした。レストランは基本的に昼に空いていますが、朝と夜でも幾つかのレストランは空いているようです。また、聞くところによると元ディズニーのデザイナーがオフィスをデザインしたみたいです。

今回はBBQのランチとスプライトをいただきました。アメリカのようなジャンキなー骨付き肉でおいしかったです。

ランチをしながら、Metaでの開発体制についても伺うことができました。私が特に気になった点は、UXリサーチャーという常に新しいUXをネット上で調査する職種があることです。彼らは調査した結果をレポートにまとめ、その洞察をもとに新しいアプリを開発するそうです。MetaはInstagramやWhat’s upなど様々な人気SNSを取り扱っていますが、特にUXと速度などのパフォーマンスに力を入れていることがよくわかりました。また、Metaには多くの従業員がいますが、1つのチームは大体12人程度で少数精鋭で開発をしているそうです。

 

Meta本社にはちょっとしたゲームセンターもありました。北斗の拳やテトリスなど10種類程度のアーケードゲームが並んでいました。レトロな日本を思い出すものが存在することに驚きます。社員の方が自分で買って設置していると聞きました。

この自動販売機はなんでしょうか?なんとヘッドホンやUSBケーブル、キーボードなど仕事で必要な電子機器が無料で購入できる自動販売機になっています。もう自分でお金を出して買いに行く必要はないですね。

IMG_0976

Metaオフィスはかなり広い街なので移動する時は、自分の車で移動するか、自転車を借りるか、シャトルバスに乗って移動します。スケールが日本と違いすぎて、なんと表現すればいいのかわかりません。こちらはシャトルバスの乗り場になっています。電車の駅と同じように、スクリーンに何時にバスが来るのか表示されています。

また一部の施設の屋上には散歩ができる道が用意されています。オフィスワークに集中できなくなった時などリフレッシュにもってこいと行った感じですね。上司と部下が会話をする際にもオフィスで座って話すのではなく、散歩しながら話すことも多いようです。

Metaオフィスの中はこんな感じになっており、四角い箱の部屋がズレて積み上げられておりデザインもかなりおしゃれです。従業員の仕事へのモチベーションなどにも繋がっているんだと思います。

Metaオフィスの全体像は以下のようになっており、約60棟もの建物からなっています。この地図だけではスケールが感じづらいかもしれませんが、イメージとしては大学のキャンパスが何個か集まった感じがしました。

実はMetaのロゴの裏はこのようになっています。Sunのようにリスクを取って革新的なものを生み出さないレガシー企業にはついていけないという逸話があるそうです。

Japan Startup Program Open House

11月4日18:00〜21:00にSVB Experience Centerで開催された、JstarxによるJapan Startup Program Open HouseにてVoicePingが展示しました。今回、展示したスタートアップの数は合計15社で、AgriTechやSaaS、BioTechなど非常に様々な種類のスタートアップが参加しました。また、会場には投資家や起業家、Googleなどの有名な大企業で働いている社員の方々を含む合計150〜200名が参加していました。

また弊社の中島が30秒のピッチを行いました。VoicePingというリアルタイム翻訳サービスについて、参加者の方々が興味を持って聞いてくれていました。

3時間という短い時間でしたが、多くの方々にVoicePingのデモを見せたり質疑応答をすることができました。VoicePingはリアルタイムで文字起こしと翻訳が表示することができますが、多くの方がその表示速度に驚いていました。速度に関しては開発チームがかなり拘った部分になるので、それが利用者に伝わっているのがとても誇らしかったです。また一番聞かれた質問としては、なぜVoicePingのAIモデルはアジアの言語に強いのか。理由は主に二つあります。まず一つ目は、VoicePingの開発チームが日本語、中国語、韓国語などアジア言語のネイティブスピーカーだからです。自分の理解できない言語では何が正しいのか間違っているのかわからないので、精度を上げることはできません。二つ目に、私たちは大量の意味のあるビジネスミーティングのデータを保有していることです。AIを学習させる上で品質の高いデータが最も重要になり、またビジネス目的のAIであればビジネスで使われているデータかどうかも重要です。

 

VoicePingはWeb会議だけでなく、対面やグローバルイベント、ネットワークが使えないオフラインの環境でも文字起こしと翻訳をリアルタイムで提供できるオールインワンのツールです。VoicePingはどんな環境であっても言語の壁を破壊して、お客様のビジネスの海外展開をサポートします。

Moon Creative Lab

11月6日は三井物産が主催しているスタートアッププログラムが運用しているシェアオフィスMoon Creative Labへ訪問させていただきました。そこで、パロアルトでシニアプロダクトマネージャーをしているHoanに会いました。私たちは以前、Moon Boost program https://www.mooncreativelab.com/boostで彼と仕事をしていました。今回は、以前からのVoicePingの成長について話をし、理想的な顧客像を1つに絞り、シンプルで簡潔なユーザー体験を提供するために直面している課題について相談しました。また、彼らが地元の起業家たちとどのような関係を築いているのかも知ることがでました。彼らによるローカル・ネットワーキング・イベント(https://www.eventbrite.com/e/networking-happy-hour-at-moon-creative-lab-tickets-1076026768029)は、サンフランシスコのエコシステムを育むでしょう。

Google本社

11月7日:Google Visitor CentorにてGoogle翻訳の開発に携わったプロダクトマネージャーと1時間の討議を行いました。VoicePingの現状と北米その他の市場への展開戦略についてフィードバックを受けました。また、Googleが常に第1位である秘訣についても伺うことができました。

Googleが競合他社の中で圧倒的な存在である理由は、ブランド認知度と製品品質にあります。Google翻訳が登場した当時、精度とユーザーフレンドリーな使用感の面で、他に匹敵する製品は存在しませんでした。自動言語検出による翻訳機能は、キラーフィーチャーでした。

多くの課金ユーザーを持つアプリを生み出す秘訣は、企業文化にあります。ハッカソンを実施し、100個のアイデアのうち97個を却下して3個だけを採用する。企業規模に関係なく、常に新しいものを創造する文化を根付かせることが、私たちが本当に見習うべきことです。

Googleの「商用アプリにする理由がなければ、無料で提供する」という理念は、ユーザー中心主義です。私たちも持続可能な限り、使いやすいアプリを無料で提供していきたいと考えています。

11月12日はNotionとStripeの本社に訪問させていただきました。

Notion本社

弊社はNotionのヘビーユーザーなので、本社に訪れることは光栄でした。Notionの本社では彼らのグローバルマーケティング戦略やVP (Value Position)などの貴重な話を伺うことができました。ある程度顧客を獲得していくと様々なフィードバックを受け取ることになると思います。フィードバックをもとに製品を洗練するのも非常に重要ですが、それと同時に革新的な機能の開発も忘れてはいけません。また、機能を全て開発しようとするのではなく、多くの顧客を獲得できる幾つかの機能にフォーカスして機能を洗練していく方がよっぽど重要です。なぜなら多くの機能を開発することにより、それぞれの機能のクオリティーが高いものにならず、顧客が必要としている機能のクオリティーが高い競合の製品に流れてしまうからです。この考え方はVoicePingにおいても非常に大切な考え方だと感じました。

IMG_1391

Stripe本社

VoicePingは決済システムにStripeを取り込んでいるので、本社へ訪れられることは光栄でした。Stripeの本社ではランチをいただきました。訪問当日がケバブの日だったようでケバブをいただきましたが、曜日によってメニューが変わるようです。バイキングのように自分が食べたいものを好きな量取ることができるシステムで、かなり食べさせていただきました。また、食事の時間には社員の方達で食堂が一杯になるほどで、一つの会社でこれだけの社員を背負うことができていることに感動しました。

IMG_1409

Nvidia本社

11月13日はNvidia本社に訪問させていただきました。VoicePingはNvidia製のGPUを多く使用しているで、本社へ訪れることをとても楽しみしていました。Nvidiaの本社はかなり広く、社内は洗練されたデザインをしておりとても綺麗でおしゃれでした。非常にわかりづらいかもしれませんが、社内の屋根や床など至る所が三角形の形をしています。これらは全て意図的に三角形の形をするように設計されており、諸説あるようでうが通気性を考えているためだそうです。またオフィスの窓は温度によって上がったり下がったりするようで、室内と外の温度を考慮して上手く調整してくれるみたいです。従業員が働きやすい環境へのこだわりがとても感じられるオフィスだと感じました。

また幸いなことにVoicePingがNvidia Inception Programに承認されました。これによりNvidiaからの多くのサポートを受けることができるようになります。AIスタートアップとして、このような機会を頂けたのは非常に光栄です。

PayPal本社

11月14日にはPayPalのオフィスへ訪問しました。そこでは以前Airbnbで働かれており主にアジアにおいて弁護士として活動されていた現PayPal社員の方とディスカッションをすることができました。私が彼とのランチで一番印象的だった議題は、サンフランシスコと日本や他の地域の文化の違いについてでした。特に日本のスタートアップなどは効率化を求める一方で、サンフランシスコのスタートアップは改革を求めることが多いです。そしてこれはスタートアップに投資する投資家やベンチャーキャピタルの思想も同様です。また、転職活動も活発で平均2年ごとに転職することが多く、地域によっては1年半またはそれ以下が通常のようです。在籍期間が短いということは、会社はなるべく優秀な社員に出ていって欲しくないです。そのために無料の食事を提供したりオフィスをより快適な場所にするなど、社員ファーストでの考え方が浸透しているのだと感じました。改革か効率化を求める違いは、ユニコーンスタートアップが生まれるかどうかに直結している考え方だと非常に感じました。

ByteDance

11月21日に開催されたByteDance Open Source Meetupに参加するためにSan JoseにあるByteDanceオフィスにお邪魔させていただきました。そこでは、MonolakeというRustのゼロコスト抽象化の力を活用して高性能なシステムを構築するフレームワークについての話がありました。MonolakeはByteDanceによって開発され、高性能なプロキシやゲートウェイを作成することができ、Nginxよりもパフォーマンスが優れているとの結果が示されていました。MonolakeはオープンソースでGithubにも公開されているので、興味がある方は確認してみてください。https://github.com/cloudwego/monolake

他にもOpenAIが開発した自動言語認識モデルWhisperについて、Whisperとは何か、どのように活用できるのか、どのようにFinetuneするのが最適かなどの話もありました。VoicePingでもWhisperをFinetuneして高性能な言語認識モデルを作成しているので、非常に有益な情報を得ることができました。

Yosemite国立公園

休日にはYosemite国立公園に行きました。公園と聞くと想像できないかも知れませんが、日本の国立公園と比較にならないほど広いです。基本的に車でないと公園の中を移動できず、岩や山、木など自然のスケールが日本と何倍も違いました。Yosemiteに到着したのがちょうど夕暮れ時ったので、山がとても綺麗に写っていました。

IMG_3807

最後に

このプログラム中の1ヶ月間は車をレンタルして移動していました。もちろん、サンフランシスコにも電車やバスは存在するのですが、本数が少なかったり、駅が思ったより遠かったりするので車がないと移動するのはとても大変だと思いました。Uberなどのタクシーを利用するのも一つの手ですが、コストや待ち時間を考慮しても車をレンタルする方が得することが多いと思います。また、アメリカでは道路上に駐車できるスペースがたくさんあるので、駐車場を探すのに苦労することは少ないと思います。

私は英語がそこまで得意ではないのですが、VoicePingのモバイルアプリを使用して英語の会話をリアルタイムで文字起こし・翻訳することで、なんとか話についていくことができました。また、会議終了後には要約を自動的に作成してくれるので、どんな話だったかすぐに振り返ることができます。無料で60分間は使用することができるので、こちらから利用するか、もっと詳しく知りたい方は一度VoicePingのサイトに訪れてみてください!

まとめ

私はアメリカに行くのが今回初めてで様々なことに衝撃を受けました。例えば規模感です。Google Mapで見ると近く見えても実際には何時間もかかることが平気でありました。他にも人との繋がりを大事にする文化です。TechCrunchなどのイベントでもそうですがネットワーキングの時間を十分に確保しており、最終的にはLinkedInで繋がりを作っておくことが常にありました。またシリコンバレーでは頻繁に投資家や起業家が参加するイベントがあちこちで開催されており、次のユニコーン企業を作ることに熱心に動いていました。これが日本とアメリカでユニコーン企業が生まれるかどうかの違いなのかと感じました。また多くの有名テック企業の本社に訪問させていただき、会社の規模感を実感したり、彼らのマーケティング戦略など様々なことを学べるいい機会となりました。

 

現在、VoicePingではAIエンジニア・Web開発エンジニアを募集しています。最先端の言語モデルを扱いたい方、高性能音声認識や翻訳モデルを作りたい方、複雑でハイパフォーマンスなWeb開発アプリケーションの設計・開発・運用をしたい方は、お気軽にご相談ください。