Rの教師なし学習行列を分類する - 正しいパッケージは何ですか?

最近スタンフォード大学の陽気なオープンクラスルームのビデオ講義を見ました。特に教師のない機械学習の部分が私の注目を集めました。残念ながら、それはもっと面白くなるかもしれないということを止めました。

基本的に私は、監督されていないアルゴリズムで離散行列を分類することを検討しています。これらの行列は、同じ範囲の離散値を含んでいます。たとえば、私は1000から20までの範囲の値を持つマトリックスがあるとしましょう。私はちょうど文学を読み始めたところで、画像の分類はもっと複雑(色のヒストグラム)であり、私の場合はそこで行われることをむしろ単純化していると感じます。

また、機械学習クラスタ Cranタスクビューですが、実際の例をどこから始めるべきかはわかりません。

だから私の質問です:パッケージ/アルゴリズムは、再生を開始し、Rの問題に取り組む良い選択だろうか?

編集: 私は、私の行列には離散的な選択肢のデータが含まれているので、正確なクラスタリングが正しいアイデアではないかもしれないことは間違っているかもしれません。私はベクトルと観測についてあなたが言ったことを理解していますが、行列やデータを受け入れる関数があることを期待しています。

EDIT2: 私は、カテゴリーデータの教師なし分類に焦点を当てたパッケージ/機能、導入は、今私にとって最も役立つものであることを認識しています。

2
ライブラリ(クラス)hclustkmeans - これは2つの基本的なものです。
追加された 著者 hatmatrix,
それはカテゴリデータにも有効ですか?
追加された 著者 Matt Bannert,
@larsmans、thx!あなたはちょうどあなたが説明したものから始まり、良い読書をしていますか?
追加された 著者 Matt Bannert,
@ ran2:クラスタリングアルゴリズムは、正しい設定のカテゴリデータに対して機能します。 1-of-Kコードを使用することは良い考えです。クラスタリングパッケージに複数の距離メトリックがある場合は、ユークリッドの代わりにL1距離を試してみるとよいでしょう。
追加された 著者 Fred Foo,
@ ran2:私のMLの知識のほとんどは、仲間との練習や議論から来ています。あなたは ESL でたくさんの情報を見つけることができます。
追加された 著者 Fred Foo,

3 答え

You might want to start from here : http://cran.r-project.org/web/views/MachineLearning.html

1
追加された
誰がこれを+1しましたか?私はダウンウォートしていません。なぜなら、皆、私はこれを握るために私を助けようとしているからです。私は元の投稿にそのリンクを投稿したばかりです。もしそれがRTFMを意味するのであれば、それを正確に書くことは正直であろう。
追加された 著者 Matt Bannert,
私はあなたを非難していない、ちょうどランダムなことについて不思議に思った。その間に私はかなりの情報を得ましたが、それは出発点を見つけるのが難しい(他のR問題と比較して)ものでした。特にあなたが探しているものを正確に知らないのならば、本当にすごいです。実際にいくつかのパッケージを見つけて、後でここで要約するのに十分なことをうまく学ぶでしょう。
追加された 著者 Matt Bannert,
元の投稿で参照されているCRAN MLのサイトに気付かなかった...!
追加された 著者 iinception,

これまでのところ、 cluster パッケージの daisy は、複数のモードのデータを処理する Gowerの類似係数を指す引数 "gower" Gowerはかなり距離のメトリックのように見えますが、それでも私はカテゴリー別データで使用するために見つけたものです。

0
追加された

...教師なしアルゴリズムで離散行列を分類する

それらをクラスタリングする必要があります。分類は、一般に教師付きアルゴリズムによって行われます。

画像の分類はもっと複雑(色のヒストグラム)であり、私の場合はそこで行われることをむしろ単純化していると感じています。

行列が表すものがわからなければ、必要なアルゴリズムの種類を知ることは難しいです。しかし、出発点は、長さ300のベクトルを生成するために20 * 15行列を平坦化することです。そのようなベクトルの各要素は、クラスタリングの基礎となる機能(または変数)になります。これは、あなたがリンクしている Cluster パッケージを含むMLパッケージが動作する方法です: "行列またはデータフレームの場合、各行は観測に対応し、 各列は変数に対応します。

0
追加された
申し訳ありませんが、不正確です。私の投稿を編集しました。
追加された 著者 Matt Bannert,
歴史的に、現在ではクラスター化と呼ばれていたクラスター化が一般的に知られています。この名前の著名な教科書もあります:アマゾン。 com /…
追加された 著者 Hong Ooi,