インタビュー

理論と実践の融合が紡ぐ「AI学習用データセット」で学術知見を社会に還元|株式会社Techno.send 鈴木章央さん

By renew編集部

|
2023.12.05
テクノセンド・鈴木章央さんのインタビュー記事のメイン画像|理論と実践の融合、AI開発の新たな潮流を生み出す、と書かれている。

AI技術の舞台裏に迫る――「AIのためのデータ作成事業」を牽引するスタートアップ企業・株式会社Techno.send(テクノセンド)。群雄割拠の「AI開発」の世界で、彼らがデータの質にこだわりを持つのはなぜ? 学生支援にも注力するTechno.send(テクノセンド)代表取締役社長・鈴木章央さんの原体験とは?AI開発の新たな潮流を生み出す、彼らの戦略や熱い思いを深掘りします。

■プロフィール
株式会社Techno.send(テクノセンド)
代表取締役社長 鈴木 章央 さん

九州工業大学大学院 生命体工学研究科 生命体工学専攻 修了。AI研究と社会の技術的ニーズを結びつける架け橋として、北九州市にTechno.send(テクノセンド)を創業。AIを活用したシステム開発、AI教育等を通じて地域社会におけるAIへの理解と関心を深めることを目指す。理論と実践の融合を促進し、学術の知見を社会に還元する独自の立ち位置を確立。社会との連携を重視し、AI技術の普及と発展に貢献している。博士(工学)。

お客さまの課題解決に資する「AI学習用データ」を事業の新基軸に

――まずは、貴社の事業内容についてお聞かせいただけますか?

鈴木:基本的にAI関連です。起業以来、大きく分けて3つの事業を展開してきました。AIを使ったシステムの受託開発、AIプログラミング教育、最後にIT開発です。

そこから派生し、最近では 「AIのための学習用データ作成事業(※)」 を立ち上げました。

データセット生成ソリューション「Dataset Generator」のサービスページキャプチャ

――「AIのための学習用データ作成事業」とは、どういうことでしょう?

鈴木:AIと聞くと、プログラムさえ準備できれば、あとは自動的にアウトプットを作り出してくれるように思うかもしれませんが、実はそうではないんです。

画像や文章などのデータを使って、AIに学習をしてもらう必要があります。ビジネス成果創出のためには、プログラムと学習用データの両輪が重要なんです。

「プログラム」については多くのプレイヤーがしのぎを削っています。GoogleやMetaのような超大手企業も、一般利用が可能な情報を公開しています(オープンソースのフレームワークライブラリ)。

一方で「学習用データ」については、まだ伸びしろがあります。なぜかというと、各社のビジネス課題に即した、オーダーメイドの学習用データが必要だからです。

――少し気になったことがあります。「プログラム」と同様、「学習用データ」もGoogleなどが提供しているのではないでしょうか?テクノセンドさんが提供する「学習用データ」と彼らのデータ、両者にはどのような違いがあるのでしょう?

鈴木:違いは明確なんです。一般に提供されている学習用データは、汎用的なアウトプット創出にしか使えません。いくら汎用的と言っても、この世のすべての課題を適切に解決することはできませんよね。

お客さまが必要としているのは「自分たちのビジネスを理解し、そのビジネスの課題解決につながる学習用データ」です。

たとえば、車をイメージしてみてください。単純に「車を作りたい」という願いを叶えるなら、車体とタイヤとエンジンと……みたいに、汎用的なパーツを組み合わせれば済むでしょう。汎用的な学習用データで実現できるのは、こういったアウトプットです。

一方、お客さまのニーズはさまざまです。先ほどの車の例で言うと、「疾走感を得たい」「地面を深く掘りたい」「たくさんの荷物を運びたい」など。こういった多様なニーズに応えるためには、特殊なパーツが必要ですよね。

当社が提供するようなオーダーメイドの学習用データは、が不可欠なんです。

▼「DATASET Generator」の5つの特徴

  1. AIを学習させるための画像データセットを短期間で納品
    人手の500倍以上の処理速度で教師データを作成できるので、10万枚の画像データセットを依頼から3営業日以内で納品。

  2. 画像収集から教師データ作成まで低予算でオーダー可能
    開発のイニシャルコストを下げることができるので、外注費を削減・低コストでAI開発着手したいスタートアップなどに最適。

  3. シミュレータ上の位置情報を元にした精密な教師データを提供
    バウンディングボックスやポリゴンのずれ、見逃しやラベル間違いというヒューマンエラーを回避。モデルの開発に専念可能。

  4. 情報伝達コスト・情報漏洩リスクを抑制可能
    画像収集や教師データ作成のためのマニュアル整備が不要。外部とのやりとりがなく1台のPCで完結するため、情報管理コストを抑制可能。

  5. PoCや初期AI開発をスキップ可能
    データセットの精度保証のために学習済みのモックアップAIモデルを納品。開発の指針策定やコアアルゴリズムのベースに使えるため、大幅な工数削減に貢献。

プラットフォーマーとの協働で、より多くのエンドユーザーへ技術を届ける

――かなりイメージができるようになってきました。では、この学習用データ事業のビジネスパートナーは、メーカーなどの事業会社を想定されているのですか?

鈴木:たしかに、「AIのためのデータ作成事業」のエンドユーザーは、私たちのようなスタートアップ企業や、AI事業を始めたばかりの企業のAI開発者です。

では、彼らが直接の取引先になるかというと、必ずしもそうではありません。

エンドユーザーのニーズはあまりにも多岐に渡ります。私たちがオーダーメイドの学習用データ作りに強みがあるといっても、個別に対応すると時間・コストがかかるため、双方にとって重荷となるからです。

私たちとエンドユーザーの間を取り持つ「AI開発プラットフォーマー」こそ、この事業のビジネスパートナーとなり得ると考えています。

鈴木:たとえば、いま流行りのノーコードツール(専門知識がなくてもアプリやWebサイトなどの制作物を作成可能なサービス)のようなプラットフォーム。これらを活用することで、より多くの人が一定水準のデザインや開発をスピーディにできるようになりました。

同様に、AIの世界にも開発プラットフォームが存在します。

AI開発者もこういったサービスを利用します。こうしたプラットフォームの開発企業に当社の学習用データを利用いただければ、より多くのエンドユーザーにリーチできます。AI開発者もコストパフォーマンスバランスよく高品質なデータセットを利用できるので、Win-Winです。

――なるほど。プラットフォーマーとしても、ニーズに合致したデータセットを保有できれば、エンドユーザーの利便性向上やアウトプット品質の向上につなげられそうですね。お取引につながりそうなお客さまはいますか?お話できる範囲で教えていただけますか?

鈴木:いま、台湾の企業とお話ししているところです。同社は、台湾の大企業や大学に使用されているAI開発プラットフォームの運営企業で、エンドユーザーのボリュームも大きいです。

私たちは学習用データを提供し、同社にて運用を回していくような座組みを想定しています。

――これからそういったプラットフォーム企業と、同社が抱える顧客の課題を解決するようなデータセット作りをやっていくということなんですね。

生成AIが流行する中、テクノセンドが注力する「認識系」の立ち位置は?

ーーところで、現在生成AIが流行していますよね。そのような用途にもテクノセンドさんの学習用データは利用されるのでしょうか?

鈴木:いえ、そのような用途は想定していません。生成AIには汎用的な学習用データが使用されるケースが主流だからです。私たちは「認識系」に強みを持っており、「生成系」とは別物なんですよ。

――「認識系」ですか?「生成系」と「認識系」の違いはなんでしょう。

鈴木:「生成系」はとにかく大量のデータが必要です。先述のペットボトルを例に挙げると「多種多様なペットボトルの画像を大量に準備する」ことが重要になるイメージです。お茶、ミネラルウォーター、ジュースなどを集めに集めて「ペットボトル画像が生成できるAI」が完成します。

一方で、私たちの主戦場である「認識系」は、細やかな違いを識別できるよう、学習用データをチューニングしています。「ペットボトルの欠陥を認識したい」というニーズに対して、「これはペットボトルの形をしているからOK」ではダメですよね。

データを解析してやっとわかることを踏まえ、AIに識別する力を身につけさせる。そういった「認識系」の研究に力を入れているんです。

学生に「いい研究生活の実現」を届けたい、その想いの原体験は・・・

――そういえば、鈴木さんは博士号を取得されていますよね。

鈴木:私は2019年3月に博士課程を修了し、工学博士を取得しました。会社を立ち上げたのは2017年です。

現在のAI流行自体は2013年ごろから始まっていますが、会社を立ち上げた2017年当時は、「AIのビジネス活用はこれから」といった温度感でした。

私はAI流行のタイミングで勉強を始めたのですが、2016年ごろから所属研究室にAIの相談が多く寄せられるようになったことを記憶しています。北九州内外問わず、相談が寄せられていましたね。

会社立ち上げの2017年ごろも北九州エリアでAIを取り扱う企業はそんなに多くなく、「じゃあ自分たちがやってみよう」と一念発起して起業したんです。