2016-03-01から1ヶ月間の記事一覧

データ分析とは

データドリブンななんちゃら、とか、集合知とか、データ分析とか、機械学習とか、そういえば最近、自分の中で意味や目的がぼんやりしたまま使っている単語が結構多くなってきたことに気付きました。 これはまずい傾向で、はっきりした目的ながないまままわり…

numpyのuniqueメソッド

numpyのuniqueメソッド これも覚えたのでメモ書き。 np.unique(array変数)の形で、array変数の要素の重複をなくしたものを返します。 ※最初に、下記でnumpyをnpとして読み込んでおきます。 import numpy as np uniqueの使い方は、下記のような感じです。 dat…

numpyのastypeとdtype、ndarrayのデータ型について

numpyのastypeとdtypeメソッド numpyのメソッドであるastypeとdtypeメソッドについてメモ。 astype astypeは、ndarrayの要素のデータ型を別のデータ型にしたndarrayを生成します。元のndarrayとは別のadarrayが生成されるので、要素を変更しても元のndarray…

日本語をpythonのコード内で使う

Kaggleで使ったりするので、python勉強中。 ちょっとハマり易いところとか、調べた内容をちょくちょくメモしていきます。 日本語をpythonのコード内で使う pythonで日本語をコード内で使おうとすると下記のようなエラーが出ます。 SyntaxError: Non-ASCII ch…

Kaggleを始めてみた(つづき) python編

前回、Kaggleのチュートリアルである、タイタニック号の事故での生存者予測モデルを作る課題を、エクセルでやってみた。 spitta8823.hatenablog.com 今回は、下記に従って、pythonを使ってやってみる。 ちなみに、自分はpython2.7をMacにインストールして使…

Kaggleを始めてみる

Kaggleとは Kaggleというサイトをご存知でしょうか? Kaggleとは、データ分析のコンペに参加したり、勉強するためのサイトで、世界中のデータサイエンティストが参加して分析のアルゴリズムを競っています。参加している人のことをカグラー(Kaggler)と言った…