星期一, 3月 27, 2006

Data Mining

前兩天去參加微軟的Data Mining短期課程,有80%都是Statistics,我唯一比較熟的是Neural Network和Linear Regression。大部份都是大學教授在講理論,所以算頗有深度;參與的學生似乎以中階主管居多,而且大部份都有Data Mining經驗。

雖然我對微軟不太滿意,但SQL2005的Data Mining做得真好用,實在厲害!不過bug也不少,April就要出SP1,真是MS風格呀!

上課心得:
1. SpamAssassin用的Bayes是蠻爛的方法,錯誤率頗高。
2. Data Mining不求精準,只求增加判斷率,能賺錢就好。
3. 資料採礦是需要許多背景知識、Domain Know How與經驗。
4. 其實微軟的軟體真的不算貴,唔,讓我想起當年的Unix工作站和PC的價差。(現在我用的Mac Mini市價13500,A牌的PC要20000,變成Unix工作站比Win PC便宜)

沒有留言: