データサイエンスグルーピングする(教師なし学習と呼ばれている何か) クラスタリング k-means法欠損データを埋め合わせるためにも使える?点がまばらに存在しているとき。点の分布を「まとまり」で見ることができます。一つ一つの点が「重さ」を持っているとして、「まとまり」の重心がもとまります。ある点がどの「まと... 2021.05.27データサイエンス
データサイエンスデータベースを試す?MySQLをインストールする。 注意。無料にも制限が、条件がある。大丈夫かな?データベースは、データ管理システムを選べたり、何やら色々と使い勝手が違う模様。progateを使ってみたけどわからない。MySQLをインストールするとりあえずこのコマンドを叩いてみた。brew ... 2021.05.19データサイエンス
データサイエンスデータベースって何?おいしいの? RDBMSに命令してデータベースデーターベース言語をSQLというプログラミング言語はパソコンに仕事を命令する言語。データーベース言語はデータ管理システムに仕事を命令する言語。RDBMSという管理システムでデータを管理するためのデータベース言... 2021.05.19データサイエンス
kaggleデータサイエンティストは機械が学習をしている夢を見る(重回帰・ロジスティク回帰の中身) 教師あり学習と呼ばれている機械学習というなにがしか外れ値、一般に値が大きくずれている、例外的なものに対してどう反応する?カテゴリーを表す数値をどう処理している?(1と2には量的な関係がない場合)などなど機械学習と呼ばれているものの中身がよく... 2021.05.16kaggle
kaggle0kaggleで何する? testとtrainのデータを比較する。二つのデータで大きな差がなければ、より適当な予測ができますね。差異が大きければ、それだけズレるでしょう。train_df.dtypesでデータの型を見てみます。タイタニックのデータを例にします。#デー... 2021.05.16kaggle
kagglekaggleのnotebookを使うと・・・ kaggler No1の人の記事kagglerのコミュニティー交差検証cross validation購買ブースティングアンサンブル説明のしにくいバグが生じる。runするごとに結果が変わる。機械学習を一つのnoteに複数いれるとよくわからな... 2021.05.11kaggle
kaggle1タイタニックからkaggleを始める。まずデータを取り込む。 kaggle のnotebookにデータを取り込みたい。notebookを開くとsave Versionの下にAdd datasというものがあるのでクリック。uploadではなく、competition dataが欲しいのでタブをクリック。... 2021.05.08kaggle