2012年2月21日火曜日

Osaka.R #7

日時:2012/02/12 13:30~18:30

遅くなりましたが、参加してきましたので簡単にレポート、というかまぁいつもの感想です。
毎日コツコツちょっよずつ書いてるのですよ!

会場の阪大、自宅から超近いんで油断してたら遅刻しそうになって車飛ばして行きました。
…が、開始時間を30分間違えていてちょっと時間つぶしていたのは内緒ですw

自己紹介

参加者が一様に自己紹介を行うという…
色々な勉強会がありましたが、こういうのは初めてでした。
学生や院生や教員、教授だったりと、大学関係者が多い感じでした。
サラリーマンってのはそんなおりません。若干アウェーだけど気にしない。

入門者講習

主催者「@phosphor_m」氏自らの発表です。

初心者も安心の、インストール&実際に触ってみよう講座です。

インストールできる環境はWin & Mac & Linuxと充実!
PC持って行きませんでしたが、他の参加者の習熟度具合や環境がちょっと見れて逆に良かったかもしれません。
一番後ろからジロジロ見てましたw

RはApacheなんかと組み合わせて面白いことできないかなーって軽い気持ちで勉強会に参加したので、個人的にはLinuxでのインストールとか気になりました。

統計の勉強とか1ミリたりともしたこと無かったので、そこに触れる話題には全く付いていけませんでしたが、ライブラリの開発の部分がすごく魅力的でした。
あと、Rのスクリプトの配列?っていうかコレクションかな?のインデックスって1から始まるんですって!VBみたいやねw
スクリプトを見ていて、「R言語」?はオブジェクト指向言語と関数型言語の両方を特徴を持っているように見受けられた。
なんかちょっと他の「プログラミング言語」とはちょっと違ったイメージです。

主催のススメ:Nagoya.Rの発足から引退まで&フォントのオハナシ

発表者は「@sakaue」氏。

勉強会なんかの主催はどんどんやったほうがいいよっていうメッセージから。
うん。言えてる。確かに。
チャンスを掴もうぜ!若人よ!って感じですかw

あと、Rでプロットするグラフなんかで使うフォントの変更方法について。
っていうかWindowsとMacでフォント変更の関数が違うんやねwマジっすかw
Linuxではどうなんやろね?ってのが気になるので、後で調べてみよう。

WindowsのMS系フォントではアンチエイリアスが効かないんできちゃないーって言ってはりました。
あとフォントきれいだからMac買え。阿呆。とも(←言ってない

そう、MS系フォントは小さいとビットマップフォントになるんです。
たしか16ポイントくらいまではビットマップフォントやったっけな??
XPあたりで搭載されたメイリオフォントを使えば少し綺麗。等幅やけどねw

Rzパッケージの紹介

主催者「@phosphor_m」氏再登場です!

Rでは「パッケージ」って呼ばれているライブラリを自作できます。
主催者自ら製作した「Rz」っていうパッケージの紹介でした。
っていうかRってGUIのフォーム?的なモノも作れるんや?ほほう。
SPSSでは簡単にできるけど、RではメンドイようなことをGUIで簡単にポチポチっと操作できるパッケージらしいです。
しかしSPSSとはいったいどのような味がするのだ?というレベルの俺には利点があまりわかりませんでした。すんません。
フォームエディタだの高機能なIDEとかは存在するんだろうか?
でなければ、まぁまぁメンドぅーんなコーディングしてそうやなぁって思ったり。でした。

Rでテキストマイニングをする前に

発表者は「@langstat」氏。

データを機械に通す前にそのデータ自身をキレイな形にしておきなさいって話です。
余分なものは取り除いて、ダブってるものは統合して…
全く地味で目立たない作業かもしれないけど、とっても大事。

ホントそのとおりだと思います!

統計だとかもう関係なくて、こういうのを面倒くさがって疎かにしてしまうことへの危険性について、声を大にして警告したい!
ニュースサイト(っていうか2chとか)でチラ見した内容を誇大妄想的に語るおっちゃん!
どこかのサイトで拾ってきたコード例をそのまま実務アプリにコピペしてろくにテストもしないエンジニア!!!

自分の思うものと一致しているか、妥当性を検討したか?
間違いが混じりこんでいないか確認したか?
いらないものが混じりこんでいないか?っていうか全部いらないものじゃないか?
チームメンバーの偉大なる努力の歯車を再開発していないか!?

インターネットが当たり前、情報のコピペが簡単にできる現状、その情報にゴミが沢山紛れていると考えてほしい。
こういったゴミを丹念に取り除いて磨き上げた情報の珠玉を作り出す作業はとっても大事だと。

俺はこうしてすっかり感化されてしまいましたとさw

Google AnalyticsとRを使ったアクセスログの主成分分析

発表者は「@seisumi」氏。

実はアジェンダを見ていて一番気になっていた発表でした。
moodleでとあるサイトを構築し、そのアクセスログをGoogle AnalyticsにかけてやってRでデータマイニングしてやったんだぜって内容です。俺は昔社員研修用にmoodleでeラーニングを構築しようとして放り出した人ですwwあれから転職してしばらく経ったことだし、もう一度手を染めたいなと、「moodle」って単語を聞かされて刺激を受けました。

seisumiさんのキャラクターにもう首ったけだったんですが、興奮はやや抑え目にワクワクして聞いてました。

が、正直やっぱりデータマイニングの部分は知識がゼロなんでさっぱりでした。
それ以外の内容については、耳で聞いていて、目で見ていてすごくわかりやすい発表で俺は好きです。
思わずコクります。

個人的にはログをどのように整形して、どのようにRに流し込んでやったのかなーなんて、実際の手順の部分が気になりました。
最終的にプロットに落とし込むまでにどうデータを料理してやろうかなーって考えるのに手間がかかる感じなんでしょうか。
一つ前の発表の、「データの整形」って部分が非常に大切だってことが再認識させられます。
あとはどの情報が必要で、いらないのか、経験とデータに対しての十分な理解が必要なんだなと、データマイニングの奥深さが垣間見えました。

Rで方言のネットワーク分析

発表者は「@aonoa732384」嬢。
まずは一言。美人でした。
見たい人は勉強会に参加しなはれw

内容としてはオンラインのフリーのデータ(「日本語情報資料館」より)をターゲットにしてデータマイニング、プロットを作るデモでした。
っていうか「めばちこ」にそんなに沢山の言い方があるのかとちょっと驚きました。

スクリプトのことを「おまじない」って呼んでましたので、我々プログラミングをする人々は「まじない師」と呼ぶのがいいんだと思います。

それはともかく、実際に行った作業をスライド上でキレイに可視化、スクリプトコードも短めにまとめてあってすごい聞きやすかったです。
で、肝心の「ネットワーク分析」ですが、これ実は何のことかわからなくて、EthernetやWebやらの用語の「ネットワーク」をイメージしていました。
ぜんぜんちゃいましたw

いや、ネットワークが何らかのリレーションを持った集合体だと考えるならば、意味的にはつながるのかもしれません。
分析結果が何らかのリレーションを持つものとして、その関係性?強度?そのあたりを可視化するのがネットワーク分析なんでしょうか?
ぜんぜんわかりませんw
ググレカスって感じですよね。わかります。


まとめー!

Rへの興味は、とある目的のためインターネットからクロールしたデータをRを使って分析し、結果を利用してWebサービスを構築できないか、といったところが発端でした。
しかし勉強会に参加してみて、統計学や言語学なんかへの造詣も少なからず必要ではないかと、またその奥深さの一端に触れて少し二の足を踏んでいる今です。

しかし、目的があればそれを実現するためにはどのようなステップを踏めばいいのか考えて一つずつ達成していく。
このステップのアイディア引き出しに一つ「R」が加わったのは大きな成果だったと言えます。
あとは自分の得意分野とRとをどう結びつけられるかが鍵だろう、そのように思います。

それでは、ここまでっ!

0 件のコメント:

コメントを投稿