リーンシックスシグマでプログラム言語 Rを使う理由とは

更新日

投稿日

 
  品質工学
 
 最近、プログラム言語 R をリーンシックスシグマで使うようになりました。ビッグデータ時代を迎え、以前から統計用のプログラミング言語を習得してみたいと思っていたので、 思い切って R 言語を試しに使ってみることにしました。
 
 リーンシックスシグマで統計処理と言えば Minitab が主流です。グリーンベルトやブラックベルトのトレーニングでも Minitab が使われていますし、リーンシックスシグマを使う企業では Minitab のフローティング・ライセンスを持ち、社員だれでも Minitab が使える環境が整っているところもあるようです。リーンシックスシグマについて書かれた本も、統計の箇所は Minitab を使って説明しているものが多いようです。 
 
 僕もいつもは Minitab を使っていますし、Minitab で十分事足りています。しかし統計学を学べば学ぶほど、統計専門のプログラム言語、例えば SAS や SPSS、そして R に興味を持つようになりました(最近は Python も統計用のプログラム言語として認識されているようです)。そこで懸案事項だった統計用プログラム言語に手を出してみることにしました。
 

1. プログラム言語の選択

 
 まずはプログラム言語の選択から始めました。SAS や SPSS は非常に高価なソフトウェアなので、個人レベルのプログラム学習にはそぐわないことから、まず選択肢から外しました。Matlab はそれほど値段は高くはありませんが、それでも小遣いで買える金額ではないので、これも選択肢から外しました。残るは R か Python です。両方ともオープンソースなので無料で使えます。
 
 統計の世界で二つのプログラム言語の利用率の推移を調べたところ、多数派だった R の利用率がどんどん下がってきており、一方で少数派だった Python がどんどん数字を伸ばしていました。またインターネット上では「R か Python どちらが良いか」という議論がたくさん見受けられました。
 
 その議論を僕なりにまとめてみると、汎用プログラム言語の Phython が数字を伸ばしている理由として、もともと統計を扱う専門者(統計家)は R を使っていた(SAS や SPSS を除いて)しかしビッグデータの時代を迎え、統計家でない一般のプログラマや、統計学を専攻にしていない一般のコンピュータ専攻学生が、ビッグデータの分野に入ってきた統計家でない一般のプログラマ達は、自分達が馴染んでいる汎用プログラム言語を使う傾向が強いそこで汎用プログラム言語の Python が統計ライブラリを充実させ、統計処理も十分行えるようになった結果として、利用率で言えば R が数字を落とし、Python が数字を上げた実際、莫大なデータを取り扱うにはメモリの関係から R よりも Python の方が有利なようです。
 
 しかし僕は R を選びました。理由は単純です。① Python はこれまでにも使ったことがあり新しく学ぶ面白みが薄い、② R は統計用プログラム言語なのでなんとなくかっこいい、③ 自分も自称統計家となりたい、それだけです。
 

2. 最初のプログラム仕様

 
 R を始める上で、最初のゴール(仕様)を決めました。それはSharePoint 上にチーム全員がアクセスできるデータベース(フォーム・ライブラリ)を作るチーム員は SharePoint 上のデータベースをいつでも更新できるクエリーを使って SharePoint 上のデータベースにアクセスし、定期的にデータをダウンロードするR をつかってデータを処理し、グラフや分析結果をレポートとして自動生成する
 
 定期的に自動生成したレポートをマネージャーに報告する
 
 この定期的(定型的)な処理とレポートの自動生成ができるところが R の強みです。これは Minitab ではなかなかできないことです。レポートの自動生成処理に必要なツールとして以下のものを使いました。
 
  • R プログラム言語
  • R Studio
  • R Markdown
 
 すべて無料のツール...
 
  品質工学
 
 最近、プログラム言語 R をリーンシックスシグマで使うようになりました。ビッグデータ時代を迎え、以前から統計用のプログラミング言語を習得してみたいと思っていたので、 思い切って R 言語を試しに使ってみることにしました。
 
 リーンシックスシグマで統計処理と言えば Minitab が主流です。グリーンベルトやブラックベルトのトレーニングでも Minitab が使われていますし、リーンシックスシグマを使う企業では Minitab のフローティング・ライセンスを持ち、社員だれでも Minitab が使える環境が整っているところもあるようです。リーンシックスシグマについて書かれた本も、統計の箇所は Minitab を使って説明しているものが多いようです。 
 
 僕もいつもは Minitab を使っていますし、Minitab で十分事足りています。しかし統計学を学べば学ぶほど、統計専門のプログラム言語、例えば SAS や SPSS、そして R に興味を持つようになりました(最近は Python も統計用のプログラム言語として認識されているようです)。そこで懸案事項だった統計用プログラム言語に手を出してみることにしました。
 

1. プログラム言語の選択

 
 まずはプログラム言語の選択から始めました。SAS や SPSS は非常に高価なソフトウェアなので、個人レベルのプログラム学習にはそぐわないことから、まず選択肢から外しました。Matlab はそれほど値段は高くはありませんが、それでも小遣いで買える金額ではないので、これも選択肢から外しました。残るは R か Python です。両方ともオープンソースなので無料で使えます。
 
 統計の世界で二つのプログラム言語の利用率の推移を調べたところ、多数派だった R の利用率がどんどん下がってきており、一方で少数派だった Python がどんどん数字を伸ばしていました。またインターネット上では「R か Python どちらが良いか」という議論がたくさん見受けられました。
 
 その議論を僕なりにまとめてみると、汎用プログラム言語の Phython が数字を伸ばしている理由として、もともと統計を扱う専門者(統計家)は R を使っていた(SAS や SPSS を除いて)しかしビッグデータの時代を迎え、統計家でない一般のプログラマや、統計学を専攻にしていない一般のコンピュータ専攻学生が、ビッグデータの分野に入ってきた統計家でない一般のプログラマ達は、自分達が馴染んでいる汎用プログラム言語を使う傾向が強いそこで汎用プログラム言語の Python が統計ライブラリを充実させ、統計処理も十分行えるようになった結果として、利用率で言えば R が数字を落とし、Python が数字を上げた実際、莫大なデータを取り扱うにはメモリの関係から R よりも Python の方が有利なようです。
 
 しかし僕は R を選びました。理由は単純です。① Python はこれまでにも使ったことがあり新しく学ぶ面白みが薄い、② R は統計用プログラム言語なのでなんとなくかっこいい、③ 自分も自称統計家となりたい、それだけです。
 

2. 最初のプログラム仕様

 
 R を始める上で、最初のゴール(仕様)を決めました。それはSharePoint 上にチーム全員がアクセスできるデータベース(フォーム・ライブラリ)を作るチーム員は SharePoint 上のデータベースをいつでも更新できるクエリーを使って SharePoint 上のデータベースにアクセスし、定期的にデータをダウンロードするR をつかってデータを処理し、グラフや分析結果をレポートとして自動生成する
 
 定期的に自動生成したレポートをマネージャーに報告する
 
 この定期的(定型的)な処理とレポートの自動生成ができるところが R の強みです。これは Minitab ではなかなかできないことです。レポートの自動生成処理に必要なツールとして以下のものを使いました。
 
  • R プログラム言語
  • R Studio
  • R Markdown
 
 すべて無料のツールです。
 

3. R が使われる理由

 
 実際に R を使ってみて、なぜ R が広く統計の世界で使われているのかがなんとなく分かってきました。R が使われる理由は以下の様なものではないでしょうか。
 
  • 無料(オープンソース)のソフトウェアである
  • 豊富な統計処理機能やグラフ機能が備わっている
  • 豊富なドキュメント、書籍がそろっている
  • 定型的な処理、レポートの作成が簡単に行える
  • 解析方法が記録できる
  • 大きなコミュニティーからのサポートが受けられる
  • いろいろなプラットフォーム上で使える
 
 今回 R を試しに使ってみて、R はリーンシックスシグマの世界でも充分使えそうだと実感しました。
 

   続きを読むには・・・


この記事の著者

津吉 政広

リーンやシックスシグマ、DFSSなど、問題解決のためのフレームワークを使った新製品の開発や品質の向上、プロセスの改善を得意としています。「ものづくり」に関する問題を一緒に解決してみませんか?

リーンやシックスシグマ、DFSSなど、問題解決のためのフレームワークを使った新製品の開発や品質の向上、プロセスの改善を得意としています。「ものづくり」に関...


「シックスシグマ」の他のキーワード解説記事

もっと見る
DFSSの典型的な型(設計フェーズと確認フェーズのみ抜粋)

   リーンシックスシグマ(DMAIC)や DFSS (DMADV)は問題解決のためのフレームワークです。そのフレームワークの中で様々なツール...

   リーンシックスシグマ(DMAIC)や DFSS (DMADV)は問題解決のためのフレームワークです。そのフレームワークの中で様々なツール...


製品開発業務が価値を生み出している時間とは

        製品開発部の複雑な開発業務の流れ整理し、迅速化し、可視化するために、リーンを製品開発部に導入...

        製品開発部の複雑な開発業務の流れ整理し、迅速化し、可視化するために、リーンを製品開発部に導入...


シックスシグマの統計的な側面

シックスシグマの統計的定義  シックスシグマは、「平均値と近接する規格限界値の間に標準偏差が6つ収まること」と定義されます。 3シグマと比較した下図で示...

シックスシグマの統計的定義  シックスシグマは、「平均値と近接する規格限界値の間に標準偏差が6つ収まること」と定義されます。 3シグマと比較した下図で示...


「シックスシグマ」の活用事例

もっと見る
改善の仕上げ、シックスシグマも最後のControlフェイズは効果確認と標準化

1.緊急監査の事例  あるサプライヤーでちょっと問題が起こり、対応策の話し合いを兼ねて緊急監査に出向いた時の事例です。一見するとQCサークル活動を全...

1.緊急監査の事例  あるサプライヤーでちょっと問題が起こり、対応策の話し合いを兼ねて緊急監査に出向いた時の事例です。一見するとQCサークル活動を全...


TRIZ を使用した DfSS事例 (その2)

   前回のその1に続いて解説します。   5. D/O(Design and Optimize/設計と最適化)フェーズ &n...

   前回のその1に続いて解説します。   5. D/O(Design and Optimize/設計と最適化)フェーズ &n...


コスト重視のシックスシグマ

 シックスシグマとは品質管理での対日本戦略として生み出され、顧客にほぼ欠陥の無いサービスを提供するというビジョンに基づいた経営管理体系です。シグマ(=σ)...

 シックスシグマとは品質管理での対日本戦略として生み出され、顧客にほぼ欠陥の無いサービスを提供するというビジョンに基づいた経営管理体系です。シグマ(=σ)...