次元の海で溺れる

Rとデータ解析と統計手法たちとわたし

2015-01-01から1年間の記事一覧

【leaflet】ラブホマップ(改)~orverpass turboを添えて~

R Advent Calendar 2015 - Qiita 16日目の記事です。初めてなので勝手が分からない。。 今回のテーマ これの続きをやります。wafdata.hatenablog.com ただやるだけだと日々進歩の無い人間だということが露呈してしまうので 小さいテーマとして シェープファ…

SappoRoR#5に行ってきました&LT資料

先日SappoRoRに行ってきました。年2回目開催!!! めでたい!!!!!楽しかったです。みなさん大変お世話になってます。。。広島関西の先生方ありがとうございました。 @R_beginnerさんのカルテどんどん進化しててわくわくするなあ。。すごいなあ。。 札幌…

【plotly,ggplot2】チョコレート狂と肥満のイケナイ関係をグリグリ動くplotにしてサイトに埋め込みたい

11月です。 キャンプをしに海を越えてやって来た友人が、「いや、まだ死にたくない」との言葉を残してホテルを取ったくらいには、冬です。試される大地が結構本気を出してきているので、 近々北海道に出張のご予定がある方は防寒に気を付けてください。 「イ…

【Nippon,infotheo,tidyr】チョコレート狂が生きていきやすい場所を探す

ここ2週間ほど バグの地雷原とログの森で迷子になっている間に、札幌では初雪が降りました。まだ夏が終わったのを受け入れていないのになんてことだ。 ということで 冬の楽しみを一生懸命考えてみました。 クリスマス → いい子にしていたからきっと12/25には…

【leaflet,ggplot2,ggmap】いたいけな気持ちでラブホテルのデータを集めてみた

毎度お馴染みの札幌からお届けしてます。(現在5℃) さむい。ほんとさむい。 TokyoRに行ってきました 先日、第51回TokyoRに初参戦してきました。一緒に行った竹馬の友が会場目前にしてぽつりと「Rよりモテそうな趣味見つけようかと思って...」と呟いた時はどう…

【R】【基本の前処理】しんぷるなサンプル抽出を考える

いい感じに韻を踏めたので大満足。 最近ggplot2系の派手めな記事が多かったんですが、 私の中でもっと大事にしたいことは山ほどあって 今日は今更地味なことを書きます。 卵が先か、サンプル抽出が先か データは全数取れるに越したことはないのですが、 世の…

【ggplot2】札幌圏におけるセイコーマートの強さをボロノイ分割で把握(したかった)

Good morning. This is Silver weeeeeeeek!!!さて。 進学で北海道に移住してからかれこれ4年とちょっと。デビューしたての頃はずっと思っていました。「セイコーマートってなんだ?」と。セイコーマート それは北海道最強を誇るコンビニです。 ローソンより…

【ggmapで遊ぶ②】巡回スープカレー屋問題を解いてみた

二回目の更新です。さっきの記事の続き!!!【ggmapで遊んだ話】札幌駅周辺のスープカレー屋マップ - 次元の海で溺れるwafdata.hatenablog.com札幌駅周辺のスープカレー屋の情報をスクレイピングしてggmapして、 誰得な食べ歩きルートを作ってやろうという…

【ggmapで遊んだ話】札幌駅周辺のスープカレー屋マップ

札幌は夏が終わってしまいましたね。近頃は恥ずかしいコードをばんばん公開して マサカリを投げて頂くことに喜びを感じて生きています。さて。小ネタが続いていて、なんか分析っぽいことをしよーと思いつつ 前処理修行が終わらないので、今週も小ネタになり…

【ggplot2番外編】企業の年収ランキングで遊ぶ~facetする意味について~

17歳冬、私は「北海道には梅雨が無いよ」と言われ 札幌にやって来ました。・・・あれから5年。・・・・・・騙された気持ちでいっぱいです。(蝦夷梅雨) 注意書き 最近はクラスタリングやらコロプレスやら色々やってましたが、 今回は番外編です。・間違った図を ・そ…

{GGally}と{Nippon}パッケージで都道府県データを腰を据えて可視化(したい)

札幌が嘘みたいに暑くて溶けそうです。クーラー。クーラーほしい。 てーま ・久々に前処理について考えたい ・そういえば日本のコロプレス図やったことない ・SappoRo.Rでも話題に出ていた{GGally}使ってみようかなてことで いつものことながらe-statです。 …

ggplot2とクラスタリング:極めて個人的な疑問に基づいて都道府県データであそぶ。~k-means編~

こんばんは巷で噂の「厚切りジェイソン」なる芸人さんが 「厚切りJSON」に脳内変換されたくらいにはJSONに汚染されてきてます。にちようび。 SappoRo.R ところで少し前に念願のSappoRo.Rに初参加してきました。 死ぬほど楽しかったです。ありがとうございま…

ggplot2実践編:都道府県別身長体重を使ってクラスタリング&結果の可視化

明日からお仕事~ 来週はいよいよSapporo.R~ggplot2とだんだん仲良くなってきた気がしなくもないので、 今週もしつこくggplot2をやります。慣れたら超楽しいね、ggplot2!!!! まだまだポンコツだけど!!! 今回のお題 【仮 説 】身長体重って、なんか地…

ggplot2で信頼区間の描画をして遊びたい 練習編

面白いデータセットを探し続けているものの なかなか見つからないので歌詞でも収集して形態素に切ってしまおうプロジェクトが 水面下で進行中です。ネットワークでも描こうか、、とも思ったけど卒論で死ぬ思いした残像がまだ、、、 ###SappoRo.R前にggplot2…

どうしてもggplot2を使ってコロプレス図を描いてみたい。練習編

平日なので、というか仕事の日なので終始ねむい。 ねむいの。むかしよりもずっと。最近、 日本の市町村のシェープファイルを取ってきてー 地図を描いてー 他のデータとマージさせてー うまいこと色分けしたいーみたいなことを考えて思うようにやったら失敗し…

Rに関する主成分分析とSappoRo.Rのはなし

あと30分で月曜日がやってきてしまう。。現実逃避がてら久々に最近ためになったSlideshareのはなし。 主成分分析 Rによる主成分分析 入門 from Hiro47 話の内容が、というより何よりも スライドの作り方が非常に勉強になりました。Rだったり機械学習だったり…

【Rでのデータ操作】前処理のための基礎の基礎の基礎【マエショリストのススメ】

失踪を諦めて人混みと日常に戻ってきて数日が経ちました。生まれてこのかた迷ってばかり。必死になったってなんにもならない上にかえって損だって わかっちゃいるんだけど。 - さて。 札幌に帰還したためR記事のリベンジをします。 定期的にマエショリスト(…

はてなブログでTex数式を書いてみる話(1)~自然言語処理シリーズ「言語処理のための機械学習入門」より~

WAF@失踪中です。特に誰にも何も告げずに札幌を飛び出して数日が経ちました。 家出です。探さないでください。「自分から逃げたい超逃げたいおなかいっぱい食べて寝たい!!!!」こんなこと言ってる失踪中の身分にも関わらず 最新の論文が何かしら受賞した…

【独学用購入検討】機械学習・統計・データ分析周りで気になる本まとめ2015

先日は 独学用に実際買ったり勉強したりしたものリストをまとめたので ↓【独学用】データ分析・統計・機械学習・自然言語処理関連で読んだ本まとめ2014 - 次元の海で溺れる今日は、気になってるけどまだ買えていないものや 今後勉強したいもの、 自らのレベ…

【独学用】データ分析・統計・機械学習・自然言語処理関連で読んだ本まとめ2014

ううう ずっとニコニコしてなきゃいけない仕事は慣れなくて疲れた、、さてここ2年(特にここ1年)で独学用に読んだ本について ざざっとまとめてみようかなと。有名どこばっかりな気がしなくもない、、、 本人情報 ・文系卒 ・4年間統計分析系の授業を取って…

地震発生データと都道府県地価データをRであれこれして知見を得る(1)

最近機械学習に勉強ばっかりしてたところふとやっぱたまには原点に返って何かしてみることも重要だよというもう一人の自分からの声が聞こえたので、おもむろにデータから作ってみることに。テーマ作ってデータ集めて なんかするのは大変久々な気がする。やっ…

「パターン認識と機械学習入門」という神のスライドについて

このスライドと出会ったのは論文に煮詰まっていた時のことです。 世はクリスマスイブとかいう聖夜のことでした。64個からの変数選択と凶悪なマルチコ処理に追われて、何かを見失い、 ロジット・・・線形判別・・・あとなんだ、SVMか・・・? そもそも機械学習ってなん…

はてなブログにslideshareを埋め込みたいひと、そうそれがわたし

いままで趣味でだらーっとRを書き、データを加工し、 スライドを作り、統計モデルを書き、 それを世に出すこともなくフォルダに保存して満足すること2年。もうちょっとうまくなりたいなーとか ちょっとおもしろいことできたきがするーとか べんきょうかいに…