2021-05

データサイエンス

グルーピングする(教師なし学習と呼ばれている何か)

クラスタリング k-means法欠損データを埋め合わせるためにも使える?点がまばらに存在しているとき。点の分布を「まとまり」で見ることができます。一つ一つの点が「重さ」を持っているとして、「まとまり」の重心がもとまります。ある点がどの「まと...
データサイエンス

データベースを試す?MySQLをインストールする。

注意。無料にも制限が、条件がある。大丈夫かな?データベースは、データ管理システムを選べたり、何やら色々と使い勝手が違う模様。progateを使ってみたけどわからない。MySQLをインストールするとりあえずこのコマンドを叩いてみた。brew ...
データサイエンス

データベースって何?おいしいの?

RDBMSに命令してデータベースデーターベース言語をSQLというプログラミング言語はパソコンに仕事を命令する言語。データーベース言語はデータ管理システムに仕事を命令する言語。RDBMSという管理システムでデータを管理するためのデータベース言...
kaggle

データを解釈する。特徴量を作る。

kaggle

データサイエンティストは機械が学習をしている夢を見る(重回帰・ロジスティク回帰の中身)

教師あり学習と呼ばれている機械学習というなにがしか外れ値、一般に値が大きくずれている、例外的なものに対してどう反応する?カテゴリーを表す数値をどう処理している?(1と2には量的な関係がない場合)などなど機械学習と呼ばれているものの中身がよく...
kaggle

0kaggleで何する?

testとtrainのデータを比較する。二つのデータで大きな差がなければ、より適当な予測ができますね。差異が大きければ、それだけズレるでしょう。train_df.dtypesでデータの型を見てみます。タイタニックのデータを例にします。#デー...
kaggle

kaggleのnotebookを使うと・・・

kaggler No1の人の記事kagglerのコミュニティー交差検証cross validation購買ブースティングアンサンブル説明のしにくいバグが生じる。runするごとに結果が変わる。機械学習を一つのnoteに複数いれるとよくわからな...
kaggle

1タイタニックからkaggleを始める。まずデータを取り込む。

kaggle のnotebookにデータを取り込みたい。notebookを開くとsave Versionの下にAdd datasというものがあるのでクリック。uploadではなく、competition dataが欲しいのでタブをクリック。...