題名:個人におけるInputとOutputの質に求めるアイデアの所在
報告者:ナンカイン
情報をうまく整理するには、InputとOutputを上手にこなすことが必要となる。このInputとOutputの関係において、ブログ界隈でも著名な方であるちきりんさん曰く、「インプットとアウトプットのバランスを意識する」、あるいは、「アウトプットの目標がないのに、インプットに時間やお金をかけるのはバカげている」と読む1)。このことから、OutputとInputの関係を見直し、何をOutputとして必要なのかを捉えることは、情報を活用する上で非常に重要なこととなろう。
一方、Neural NetworkにおけるInputとOutputの関係は図のように示される。近年では、生物学・医学的な実験結果や化学分析、気象学、遺伝学において、このNeural Networkの技術が様々に用いられているが、その調査の元となるデータベース、または、データセット、すなわち、Input側には、必ず欠損値が含まれていることが多い2)。例えば、センサの故障や実験への反応に伴う誤った値の測定は、結果としてOutputの質を下げることがある。そのため、Neural Networkだけでなく、遺伝的アルゴリズムやk近傍法などを併用することで、その質を上げることも検討されている2)。
図 Auto-associative neural networks2)
これと同じくして、個人の情報収集には必ずバイアスが掛かる。この記事でも示されたように、ネットサーフィンすらもその裏の技術(Cookie)によって個人の趣向がメインとなり、必然的に嫌いなものを避けてしまう傾向がある。これはある意味、個人のInput側におけるデータの欠損値にもなり得る。いくら内部の隠れ層(図のHidden Layerに相当)の精度を上げたとしても、あるいは、層を増やしたとしても、様々な方法を併用しなければ、個人のOutputの質は上がらないことをも意味する。
個人における良質なInputは、一般的な製書となるであろうか。あるいは、今ではTVやインターネット上の情報がメインとなろうか。どちらにせよ多くのデータセットを求めるには、えり好みをせず、乱読、あるいは、乱覧がよく、その中から目標となるOutputのヒントを得ることも大事になるのかもしれない。例えば、流行り廃りの激しいお笑いの世界で、12年もの間視聴者を引き寄せ続けている番組にテレビ東京「ゴッドタン」がある3)。その製作チームを率いる佐久間宣行P曰く、アイデアの元となる所在について、「昨日も映画の試写2本と、深夜に映画を1本見に行きました。僕、Googleカレンダーに2ヶ月先ぐらいまで「テレビを見る時間」とか入れてるんです。本を読むのは「B」って書いて予定を抑えたり、映画の公開時期も全部調べて予定に入れてます。予定がかぶると、調整くんみたいなやつでふるいにかけて、いける日を決めて(笑)。… そこまで管理してでも、インプットを続けたいんです。ドラマも1週目は全部撮って、土日に全部まとめて見ます。本当に苦行で、朝までかかったりするんですけど(笑)。移動中はネットドラマを見ています。」3)とのことである。この努力が良質のOutputを産み出すきっかけとなっていることに相違ない。
1) ちきりん: ゆるく考えよう 人生を100倍ラクにする思考法. イースト・プレス. 2013.
2) Aydilek, IB. Arslan, A.: A novel hybrid approach to estimating missing values in databases using k-nearest neighbors and neural network. Int. J. Innovative Comput. Inf. Control 7: 4705-4717, 2012.
3) https://www.buzzfeed.com/jp/hikaruyoza/the-god-tongue?utm_term=.do4DoX0mP#.obl2WNwKg (閲覧2017.8.28)
From ここから。© 2015 This is 地底たる謎の研究室 version。