K-mean สามารถใช้จัดหมวดหมู่ข้อมูลข้อความได้หรือไม่

สารบัญ:

K-mean สามารถใช้จัดหมวดหมู่ข้อมูลข้อความได้หรือไม่
K-mean สามารถใช้จัดหมวดหมู่ข้อมูลข้อความได้หรือไม่
Anonim

K-mean คือ อัลกอริธึมคลาสสิกสำหรับการจัดกลุ่มข้อมูล ในการทำเหมืองข้อความ แต่ไม่ค่อยมีใครใช้สำหรับการเลือกคุณลักษณะ … เราใช้วิธี k-mean เพื่อจับคลัสเตอร์เซนทรอยด์หลายอันสำหรับแต่ละคลาส จากนั้นเลือกคำที่มีความถี่สูงในเซนทรอยด์เป็นคุณสมบัติข้อความสำหรับการจัดหมวดหมู่

k-mean ทำงานกับข้อมูลหมวดหมู่หรือไม่

The k-Means algorithm is not suitable for categorical data เนื่องจากตัวแปรตามหมวดหมู่จะไม่ต่อเนื่องและไม่มีที่มาจากธรรมชาติ ดังนั้นการคำนวณระยะทางแบบยุคลิดสำหรับพื้นที่ดังกล่าวจึงไม่มีความหมาย

k-mean ใช้สำหรับการจัดกลุ่มข้อความได้ไหม

K-means clustering is type of unsupervised learning method ซึ่งใช้เมื่อเราไม่มีข้อมูลที่ติดป้ายกำกับ เช่นในกรณีของเรา เรามีข้อมูลที่ไม่มีป้ายกำกับ (หมายถึง โดยไม่มีหมวดหมู่หรือกลุ่มที่กำหนดไว้)เป้าหมายของอัลกอริธึมนี้คือการค้นหากลุ่มในข้อมูล ของกลุ่มแสดงโดยตัวแปร K.

เราใช้ k-mean จำแนกได้ไหม

KMeans คืออัลกอริธึมการจัดกลุ่มที่แบ่งการสังเกตออกเป็น k คลัสเตอร์ เนื่องจากเราสามารถกำหนดจำนวนคลัสเตอร์ได้ จึงสามารถใช้ในการจัดประเภทได้อย่างง่ายดาย โดยเราแบ่งข้อมูลออกเป็นกลุ่มซึ่งสามารถเท่ากับหรือมากกว่าจำนวนคลาสได้

อัลกอริธึมการจัดกลุ่มใดดีที่สุดสำหรับข้อมูลข้อความ

สำหรับเวกเตอร์ข้อความคลัสเตอร์ คุณสามารถใช้ อัลกอริทึมการจัดกลุ่มแบบลำดับชั้น เช่น HDBSCAN ซึ่งพิจารณาถึงความหนาแน่นด้วย ใน HDBSCAN คุณไม่จำเป็นต้องกำหนดจำนวนคลัสเตอร์เหมือน k-mean และส่วนใหญ่จะมีประสิทธิภาพมากกว่าในข้อมูลที่มีเสียงดัง