python

PandasのDataFrame関連でよく使うTips

自分のためのメモ。 主にデータ分析用途でサクッとDataFrameにデータを格納して、いろいろいじりたいときに使う前処理や統計値確認メソッド。 Nullがあるか確認して適当に埋める # df全体にあるnullの数をカウント df.isnull().sum() # 特定のカラムにあるnu…

pandasでグラフを描くときのTips

pandasでDataFrameとしてデータをインポートしてから、とりあえずグラフ化して分布を確認したいことがよくあります。 そのときに個人的によく使うコードをメモ。 細かい設定とかでビジュアル整えようと思ったら、いくらでも設定あるらしいのですが、実際にpy…

numpyのndarray、pandasのSeriesとDataFrameの使い分け

分析する元データをcsvファイルとして取り込む際、pandasのDataFrameをよく使います。大体、下記のような感じでとりあえずcsvファイルをDataFrame型変数に格納し、可視化や成型を行なっていきます。 import pandas as pd df_train = pd.read_csv("___.csv") …

データ分析の勉強方法

データ分析の勉強方法 データ分析に慣れるために日々色々と情報収集しています。 そんな中で、見つけた記事を紹介します。 自分が最近データ分析に関する情報収集のためによく見ているサイトanalyticsvidhya Analytics Community | Analytics Discussions | …

codecademyのpythonコースをやってみた

codecademyというプログラミング言語を学べるサイトでpythonコースをやっていて、つまづいたところをメモ。 Catalog | Codecademy [Lists and Functions Forum]の[Printing out a list item by item in a function] 大体全体の52%くらいまで進んだところで、…

numpyのastypeとdtype、ndarrayのデータ型について

numpyのastypeとdtypeメソッド numpyのメソッドであるastypeとdtypeメソッドについてメモ。 astype astypeは、ndarrayの要素のデータ型を別のデータ型にしたndarrayを生成します。元のndarrayとは別のadarrayが生成されるので、要素を変更しても元のndarray…

日本語をpythonのコード内で使う

Kaggleで使ったりするので、python勉強中。 ちょっとハマり易いところとか、調べた内容をちょくちょくメモしていきます。 日本語をpythonのコード内で使う pythonで日本語をコード内で使おうとすると下記のようなエラーが出ます。 SyntaxError: Non-ASCII ch…

Kaggleを始めてみた(つづき) python編

前回、Kaggleのチュートリアルである、タイタニック号の事故での生存者予測モデルを作る課題を、エクセルでやってみた。 spitta8823.hatenablog.com 今回は、下記に従って、pythonを使ってやってみる。 ちなみに、自分はpython2.7をMacにインストールして使…