Dropboxが自社サービス上の「ファイルプレビュー機能」を機械学習で効率化することで、170万ドル(約1億7000万円)の費用削減を達成しました。具体的なシステムの内容について、機械学習エンジニアのWin Suen氏が説明しています。
Dropboxはアップロードされたファイルを素早くプレビューするため、「Riviera」という内部システムを利用して事前にファイルのプレビューデータを生成しているとSuen氏は説明。しかし、事前に生成したデータが利用されず無駄になるケースもあったため、機械学習で事前生成すべきデータを予測し、データ生成時のマシンリソースを節約するプロジェクト「Cannes」が発足することになりました。
Cannesの開発にあたり、チームが重要視したのは「予測が外れた場合のパフォーマンス低下の許容範囲」と「機械学習モデルのシンプルさ」だったとSuen氏。前者はプレビュー表示チームと協力することで許容範囲を線引きし、その線引きを機械学習の精度目標にしたそうです。また、後者についてはなるべく機械学習モデルをシンプルにすることで、「なぜその予測結果が生まれたか」を明確にし、導入初期におけるデバッグを容易にする狙いがあったとSuen氏は語っています。
このニュースをすぐに読めるように要約しました。ニュースに興味がある場合は、ここで全文を読むことができます。 続きを読む: