Top View


Author shimao

AWS re:Invent2019のAI関連アップデートまとめ

2019/12/13

対象者(前回と同じ)

  • AWSが好きな人
  • AWSのAI系サービスに興味がある人

まとめ方(前回と同じ)

1アップデートにつき数行程度でまとめます。また、以下の5軸でまとめます。(公式のメニューを参考にしています)

  • AI Services

    • AIの成果を誰でも簡単に使えるサービス。Amazon Rekognition、Amazon Comprehendなど。
  • ML Services

    • AWSで機械学習の開発・本番化を簡単に行うためのサービス。主にSageMaker。RoboMakerも勝手にここに入れました。
  • ML Frameworks

    • TensorFlow等の機械学習フレームワークへの対応。DeepLearning AMIも。
  • ML Infrastructure

    • 機械学習のためのインフラサービス。GPUインスタンス、Elastic Inferenceなど。
  • その他

AI Services

Amazon Reckognition Custom Labelsを開始

内容

  • 顧客独自の画像分析機能(独自の対象物やシーンを検出)を構築できる。
  • 例えば、画像から機械部品を検出するとします。「ターボチャージャー」や「トルクコンバーター」を検出するためにラベル付けされた小数の画像を使って、MLモデルを学習させることが出来る。

所感

  • 要はReckognitionのモデルがファインチューニング可能になったと理解した。
  • 同じようなサービスでGCPのAutoML Visonがあるけど、こっちは3.15ドル/時間で、Reckognitionは1.0ドル/時間なので、比較的気軽に使えるかも。
    • GCPのAutoML Visonについて、詳しく知らないのであくまでも金額の参考としてご認識ください。(内部でやってることは結構違いそう)

参考

自動コードレビューサービス:Amazon CodeGuruをリリース

内容

  • 機械学習を用いてパフォーマンスに関するコードレビューを自動で行うサービス。
  • CodeGuru ReviewerCodeGuru Profilerの2つで構成される。
    • 両方とも現在はJavaのみサポート。
  • CodeGuru Reviewer
    • 自動化されたコードレビューと推奨事項を提供。
    • リポジトリとしてGitHubとAWS CodeCommitをサポート。Pull Requestベースでコードレビューを活用できる。
  • CodeGuru Profiler
    • テストフェーズで、ハイコストなコードを検出、最適化。
    • 運用フェーズで、パフォーマンスとコストの改善点を簡単に特定。
    • 本番環境で継続的に実行され、最小限のCPU容量を消費するため、アプリケーションのパフォーマンスに大きな影響を与えない。
  • 現状まだプレビューで、東京リージョンは未対応。

所感

  • Java使わないので個人的には刺さってないが、今後の他言語サポートに期待。

参考

Amazon Fraud Detectorを発表

内容

  • オンライン支払い詐欺や偽アカウントの作成など、潜在的に不正なオンラインアクティビティを簡単に特定できるフルマネージドサービス。
  • Fraud Detectorは、機械学習(ML)とAWSおよびAmazon.comの20年にわたる不正検出の専門知識を使用して、不正行為の可能性を自動的に特定し、より多くの不正行為を迅速に発見できるようする。数回クリックするだけで、MLの経験不要で不正検出モデルを作成できる。

所感

  • また便利なサービスが出てきた。刺さる人にはめっちゃ刺さりそう。

Amazon Kendraを発表

内容

  • 機械学習を活用した非常に正確で使いやすい新しいエンタープライズ検索サービス
  • 社内に散らばったデーターをKendraで統合し共通のインタフェースを使って検索できる。(マニュアル、調査レポート、FAQ、HRドキュメント、カスタマーサービスガイドなど)
  • 検索結果に対するユーザーからのリアクションを元に、検索機能が最適化される(バックエンドで機械学習が実行される)
  • データソースとして、Box、Jira、DropBox、Confluence、DropBox、SalesForce、SharePoint Online、JDBC、S3が使える。
  • 現在プレビュー中。

所感

  • SNS見てて、発表時にリアクションが大きかったサービスと言う印象。
  • 上手く使えば間違いなく便利になりそうなので、弊社でも導入したい。

参考

Amazon Transcribe Medicalを発表

内容

  • 文字起こしサービスのTranscribeの医療向け版サービス。
  • 臨床医と患者の音声をテキストに変換するように設計されている。

所感

Contact Lens for Amazon Connectを発表

内容

  • Amazon Connectで行われた通話情報を解析し、テキストに書き起こしするフルマネージドサービス。
  • 顧客の通話を自動的に書き起こし & 分析し、以前に録音した通話を書き起こす。
  • スピーカー検出で全文転写を入手、既存のソリューションの2倍の精度。
  • 感情、長い沈黙、およびエージェントと顧客が互いに話し合っている時間を分析。
  • キーワード、フレーズ、分析基準についてすべての文字起こしを検索
  • 通話が行われているときに、ほぼリアルタイムで文字起こしを確認できる

所感

  • いままでもAWSの色々なサービスを組み合わせればできたけど、それをマネージドサービスとして出してあげたよ、みたいな印象。
  • コールセンターに本当にそのまま導入できそう。

ML Services

Amazon Augmented AIの発表

内容

  • Amazon Augmented AI(Amazon A2I)を使用すると、MLの予測結果に対する人間によるレビューシステムを簡単に構築および管理できる。
  • 多くの機械学習アプリケーションでは、結果が正しいことを確認するために人間が信頼性の低い予測を確認する必要がある。しかし、人間のレビューシステムの構築は、時間と費用がかかる。
  • 米国東部(バージニア北部)リージョンでパブリックプレビュー中。

所感

  • 個人的に期待しているサービス。ぜひ使ってみたい。
  • MLのアフターフォロー的なサービス。予測結果の確認・修正システムは実運用を考えると必須なので、これを使うことで本当に簡単になるんだったら素晴らしいと思う。
  • 現状は、「確認・修正システム」というレベルではなく、モデル評価の一環レベルっぽい。
  • 役回り的に納得だけど、サービスの作りがSageMaker Ground Truthと似てる。

参考

Amazon SageMaker Processingを発表

内容

  • フルマネージドなデータ加工とモデル評価サービス。
  • 以下のような前処理を簡単にできるサービスっぽい。
    • カテゴリ変数のOne-Hot エンコーディングのような、既存の特徴量をさらに表現力の高い特徴量へ変換
    • 数値型特徴量のリスケールや標準化
    • 住所をGPSの座標に置き換えるような、高レベルな特徴量の作成
    • 自然言語処理を適用するための文章のクリーニングやトークン化
  • 後処理ジョブ(フィルタリングや照合など)やモデル評価ジョブ(異なるテスト用データセットに対するスコアリング)にも使えるらしい。

所感

  • これ系のサービスは使ってみないと良し悪しがわからないので使ってみたい。
    • 表データ系の話は現状そんなに困ってないので、自然言語で使ってみたい。
  • フルマネージドって言ってるけど、たぶん機械学習知らなくても使えるって感じでは無さそう。

参考

Amazon SageMaker Experimentsを発表

内容

  • モデルバージョンを整理、追跡、比較、評価できる。
  • 実験結果を簡単に管理できる。入力、パラメーター、構成、および結果を自動的に追跡する。

所感

  • これはまさに求めたサービス(いままでなかったのかというレベル)。
  • より「SageMakerを使わない理由はない」世界になった気がする。

参考

Amazon SageMaker Studioを発表

内容

  • 機械学習向けの統合開発環境(IDE)であり、機械学習モデルを簡単に構築、トレーニング、デバッグ、デプロイ、監視できる。
  • 米国東部(オハイオ)リージョンで、一般的に利用可能。追加のリージョンは近日中に提供される予定。現在、プレビュー中。

所感

  • SageMakerの様々なサービス群(Autopilot、Experiments、Debugger、Model Monitorなど)を使った開発がやりやすいのかなと思っている。

Amazon SageMaker Debuggerを発表

内容

  • Amazon SageMaker Studioのビジュアルインターフェイスを使用して、トレーニング中にモデルの特性を簡単に分析およびデバッグできる。
  • 異常が検出されると、SageMaker Debuggerは開発者に修復アクションを実行するためのアラートを送信し、モデルのデバッグにかかる時間を短縮する。

所感

  • SageMaker Studio使ってみないと便利さがわからなそう。

参考

Amazon SageMaker Notebooksを発表

内容

  • 開発者は数秒で機械学習ノートブックを起動し、ワンクリックでノートブックを共有できます。
    • インスタンスを選択して操作可能になるのを待つ必要がない。
  • パブリックプレビュー中。現在、米国東部(オハイオ)リージョンのみだが、追加のリージョンは近日中に提供される予定。

所感

  • SageMakerのノートブックインスタンスを作ること無く(または待たずに?)、ノートブックが使えるということと理解。Google Colabみたいな使用感かなと予想している。めちゃ便利そう。

Amazon SageMaker Autopilotを発表

内容

  • 表形式のデータと指定したターゲット列を使用して、モデルを自動的にトレーニングおよび調整し、プロセスを完全に可視化できる。
  • 機械学習の深い知識がなくても分類および回帰モデルを構築できる。
  • 東京リージョンでも使える

所感

  • GCPのAutoML Tables的なものと理解。
  • どの程度使えるのか、試してみたい。特徴量エンジニアリング部分とか気になる。

Amazon SageMaker Support for Deep Graph Library (DGL)を発表

内容

  • SageMakerがDeep Graph Libraryをサポート。
  • Graph Neural Networks(GNN)を使ったモデル構築が可能に。

所感

  • GNNは正直あまり追えてないけど、こういうサービスに取り込まれ始めているのを見ると今後普通に使われるようになっていくんだろうなと感じた。勉強せねば。

Amazon SageMaker Operators for Kubernetesを発表

内容

  • Kubernetesを使用する開発者がAmazon SageMakerでMLモデルのトレーニング、調整、デプロイを容易にするためのもの。
  • モデルのトレーニング、モデルのハイパーパラメーターの最適化、リアルタイムの推論、およびバッチの推論を行うことができる。

Amazon SageMaker Model Monitorを発表

内容

  • エンドポイントから予測リクエストとレスポンスを簡単に収集し、本番で収集されたデータを分析し、トレーニングまたは検証データと比較して偏差を検出できる。
  • 組み込みルールを使用して、構造化データセットのドリフトをすぐに検出したり、組み込みルールを実行する前にデータ変換を追加したり、独自のカスタムルールを記述したりできる。
  • 監視ジョブは、定期的実行のスケジューリングができAmazon CloudWatchと連携できる。

所感

  • 本番運用中のモデルエンドポイントの監視を容易にするサービスと理解した。

ML Frameworks

Deep Java Libraryを発表

内容

  • Javaで深層学習開発するためOSSライブラリであるDJLを発表。

所感

  • Java勢歓喜しそう。

AWS Deep Learning AMIの更新

内容

  • Tensorflow 1.15&2.0、PyTorch 1.3.1、およびMXNet 1.6.0-rc0をサポートしたらしい。

所感

  • TF2.0、PyTorch 1.3対応は嬉しい。

ML Infrastructure

機械学習推論向けインスタンス Inf1

内容

  • Inf1インスタンスは、機械学習の推論を実行することに特化したインスタンスで、クラウド上でもっとも高速に推論が可能なサービスとのこと。
  • Inf1は、re:Invent 2018で発表されたASIC、Inferentiaチップを搭載している。
  • G4インスタンスと比較し
    • 超低遅延
    • 3倍の高スループット
    • 推論あたり40%の低コスト
  • TensorFlow/PyTorch/MXnetなどの機械学習フレームワークとの統合。
  • ECS/EKS/SageMakerでサポート予定。
  • 現時点では、バージニア(us-east-1)、オレゴン(us-west-2)の2つのリージョンで利用可能

所感

  • Elastic Inferenceとの使い分けが個人的に分からなかったけど、細かい点でこのユースケースではこっちのほうが良いみたいな感じで使い分けるのかなと想像している。

その他

AWS DeepRacerの拡張

内容

  • マルチカーレースとオブジェクト回避機能をサポート。直接対決レースのモデルを構築できるようになった。

所感

  • すごい。マリオカートみたいなことができるのかな。笑

Amplify iOSおよびAmplify Androidのプレビューをリリース

内容

  • AmplifyはAWS製のJavaScriptライブラリ。
  • iOS・Android対応したよ、という話と理解。
  • 分析、AI / ML、API(GraphQLおよびREST)、データストア、ストレージなどの機能をモバイルアプリケーションに簡単に追加できるらしい。

所感

  • Amplify、あんまり聞き覚えがなかったので新鮮だった。覚えておこう。

参考

AWS DeepComposerを発表

内容

  • 世界初の機械学習対応キーボードデバイス。
  • DeepRacerと同様に、開発者が機械学習について学べるように設計されているらしい。
  • キーボードデバイスを使って適当なメロディを入力後、楽曲ジャンル(ジャズ、ロック等)を選択すると、AIが楽曲を作ってくれると理解している。(GANを使っている?っぽい)

所感

  • 新しいデバイスきた!
  • 内容的にはMidiMeのようなものかなと思っている(MidiMeはMusicVAEベースだけど)
  • デバイス&サービスを作って販売しちゃうのがAWSのすごい所だなと思う。

参考

所感

  • DeepComposerやCodeGuruなども衝撃的だったけど、個人的には「SageMaker祭り」だったなと思った。
  • SageMakerは機械学習の統合開発環境になっていて、本番運用を見据えるなら「SageMakerを使わない理由はない」という世界になっているなと感じる。
  • 前回の記事と合わせて、ものすごい数のアップデートがあったので、色々試してみたいし、上手く普段の開発取り入れて、もっと楽がしたいなと感じた。

主な情報ソース

終わりに

明日のFusicアドベントカレンダーはTsuMakotoが担当です。乞うご期待ください。

shimao

shimao

福岡在住。機械学習エンジニア。AWS SAP・MLS。趣味はKaggleで、現在ソロ銀1。福岡でKaggleもくもく会を主催しているので、どなたでもぜひご参加ください。