グーグルのクラウドを支えるテクノロジー > 第31回 バグ予測アルゴリズムとその実効性のケーススタディ(パート2)
私がマーケティング支援しているCTC教育サービスで中井悦司氏のコラム「 グーグルのクラウドを支えるテクノロジー > 第31回 バグ予測アルゴリズムとその実効性のケーススタディ(パート2)」が公開されました。
Googleはさらに勢いが出てきましたね。Googleクラウドを追いかけている方は是非ご覧ください!!
###
はじめに
前回に続いて、2013年に公開された論文「Does Bug Prediction Support Human Developers? Findings from a Google Case Study」をもとにして、「バグ予測アルゴリズム」の実効性に関するレポートを紹介します。学術的に評価の高いアルゴリズムである「FixCache」、そして、よりシンプルで直感的な「Rahmanアルゴリズム」の2種類を取り上げて、これらの有効性や実用化に向けた課題を検証することがレポートの目的となります。
インタビュー調査の結果
前回説明したように、これらのアルゴリズムを実際のプロジェクトに適用するに先立って、アルゴリズムの有効性について、ソフトウェア開発者に対するインタビュー調査が行われました。2つの開発プロジェクトを選定して、3種類のアルゴリズムが選びだした「バグを含む可能性が高いファイル一覧(上位20ファイル)」を実際の開発メンバーに評価してもらうというものです。対象となるアルゴリズムは、「一覧サイズを制限したFixCache(Cache-20)」「変更数でランクづけしたFixCahce(Duration Cache)」「Rahmanアルゴリズム」の3種類です。(それぞれの違いについては、前回の記事を参照してください。)
インタビュー対象となったのは、さまざまな経験年数を持つ19名の開発者で、各ファイルについて、実際に開発に関わっている知見に基いて、「Bug-prone(バグを含む可能性が高い)」「Not bug-prone(バグを含む可能性は低い)」「Unknown(わからない)」というラベル付けを行います。その結果を集計したものが図1のグラフになります。
この続きは以下をご覧ください
https://www.school.ctc-g.co.jp/columns/nakai2/nakai231.html