Kizuna Dataset Catalogue は、ライセンス条件と品質が明示された法人向けAI学習データセットを、必要な粒度で調達できるマーケットプレイスです。
人手と自動を組み合わせた高品質なパイプラインで生成し、徹底した品質検証を実施した合成データセットです。弊社の音声対話生成パイプラインをベースとしており、会話の感情分析、話者分離・話者識別、会話生成モデルの学習に適しています。本データセットは日常的なAIとの対話シーンを想定していますが、コールセンターや接客シーンなどを想定したデータセットの合成にも対応可能です。
感情・対話・多話者など、日本語AI開発に欠かせない音声・テキストデータを厳選して提供。
自動と人手を組み合わせることで、効率よく・低コストに・高品質なデータセットを実現しています。
話者数・ドメイン・ラベル形式の調整から、独自データセットの新規構築までご相談ください。
東京リージョンから暗号化配信。NDA・データレジデンシー要件にも対応します。
自社ユースケースに合わせたカスタムデータセットの構築、既存データセットの拡張・ラベル追加、NDA 前提のセキュアな受け渡し、専属サポートまでご相談いただけます。