SONY

メニュー
サイト内検索ボタン

検索

AI & Machine Learning

コンパクトかつ高性能なAIを追求する

音声信号処理・音声認識

雑音や残響のある環境も想定し、ユーザーが自然に話す音声を正確に認識する技術を開発しています。そのためにソニーは「音声信号処理」と「音声認識」の技術開発に取り組み、音声の認識性能向上を追求しています。例えば、ロボティクスの音声インタラクションで動作時にメカノイズが生じるような劣悪条件においても深層学習型の音声信号処理・音声認識の最適統合を行うことにより高い音声認識性能を実現しています。このように機器形状やユースケースに合わせた技術の最適化により、徹底的な使い勝手の良さを実現します。

発話意味解析・自然言語処理

ユーザーの発話を理解するために、音声認識された発話文字列を、機械が解釈可能な情報形式(意味表現)に変換する「発話意味解析」の技術を開発しています。言い淀み、省略など様々な言語現象のモデル化と、言葉と実世界を関係づける意味体系のモデル化により、多様な発話表現に対応しています。また、自然言語そのものを理解するために、単語の切り出し、品詞や属性の付与、構文構造の抽出など、テキストを解析する「自然言語処理」と、曖昧性を含む言語情報を適切に解析する「知識情報処理」の技術を開発しています。

Deep Learning

Deep Learningは機械学習技術の一つであり、訓練データを用意することであらゆるデータに関する「認識・予測」、「生成・変換」を行うことができます。ソニーでは要素技術として、大規模データ・モデル学習、モデル探索・圧縮、転移学習、生成モデル・ニューラルレンダリングなどの研究を行っており、それらの成果をGUIによる開発ツールNeural Network Console、オープンソースライブラリNeural Network Librariesと合わせて公開し、世界のAIの発展に積極的に貢献しています。これらの技術は、これまでにも多くのAI応用を実現しているエレクトロニクス製品だけでなく、映画・音楽・ゲームといったエンターテインメントビジネスやその他新規事業と多岐にわたり活用されます。

行動学習

「行動学習」は強化学習に代表されるように、自律システムが試行錯誤を通じて環境に適した行動を獲得する技術。人が設計しきれないほど複雑・多様な状況での行動計画や、事前の想定を超えて変動する環境に追従するオンライン最適制御を主な目的とし、Navigation(地図獲得と自律移動)とManipulation(物体操作)などのロボティクス課題やゲームAI分野への応用を目指しています。海外大学や研究機関との共同研究も積極的に行ない、最先端技術を取り入れた研究開発を進めています。

エージェントプラットフォーム

ユーザーの発話やテキスト入力を理解して、音声とビジュアル表現を組み合わせ、生き生きとしたキャラクター表現で応答を返すエージェントプラットフォームを開発しています。このエージェントプラットフォームは、音声認識や画像認識、発話意味解析、対話応答生成、ビジュアル表現制御など、様々な技術を組み合わせて実現しています。また、対話アプリケーションを開発するためのツール、SDK、クラウドシステムの開発も進めています。アニメ・映画などの「エンタテインメント領域」、ライフプランのサポートなどの「金融領域」、店舗やオフィスの受付や案内といった「B2B領域」でのアプリケーション活用が進められています。

データ分析

ソニーグループ各事業においてデータ利活用による新しい顧客価値やビジネス創出の動きが活発です。ソニーグループには、エンタテインメント・エレクトロニクス・ネットワークサービス・金融など様々な事業があり、多種多様なデータが日々生まれています。それらのデータを効果的かつ簡単に活用できるよう、新しい機械学習技術と分析プラットフォームを研究開発しています。具体的な取り組みとして、例えば機械学習や統計の専門家でなくても予測分析を簡単に実行できるPrediction Oneや、DTC(Direct to consumer)サービスにおける個人化のための因果推論技術などがあります。これらコア技術と分析プラットフォームによって先端技術を社会実装していきます。

GAIA

あらゆる商品・サービスにAI機能が当然のように利用されていますが、その中核となる技術がDeep Learningです。しかしながら、より高度なAI機能の開発のために、利用される学習データ量は年々増加し、また学習に利用するモデルも巨大化していくため、Deep Learningの学習時間は年々増加の一途を辿っています。そこで、ソニーでは、AI開発のためのスーパーコンピューター(GAIA)の構築と技術開発を行っています。特に、最新のH/Wをベースに「AI開発に最適なアーキテクチャ技術」、H/Wリソースを最大限活用するための「リソースマネジメント技術」、複数のGPUなどのプロセッサを利用し超高速な学習を実現する「大規模分散学習技術」に注力しています。これらの技術をGAIAに統合し、さらに社内の学習データ共有システムであるsDataと連携することで、AI技術開発の高速化の実現とAIによる新たな価値の実現を目指しています。

説明可能なAI

説明可能なAIとは、ブラックボックスと言われる機械学習を人間が理解できるように、判断根拠の可視化する技術です。このテーマの目標は、信頼されるAIを構築することです。近年の機械学習の進展は目覚ましく、あらゆる分野にて技術革新をもたらしています。その一方で、AIが人間を傷つける倫理問題も生じています。そこで、機械学習における公平性、説明性、透明性を技術にて解決するために、説明可能なAIの研究開発に取り組んでいます。説明可能なAIによって、どのような理由でAIが判断を下したのかを人間が理解し、コントロールできるAIを目指しています。

このページの先頭へ