Web mining

posted on 20 May 2008 14:29 by m2byrd

จำนวนข้อมูลของเว็บเพจมีอยู่มากมายมหาศาลทำให้ เว็บนั้นกลายเป็นที่ที่ว่างที่ใหญ่โตของ information ดังนั้น
search engines จึงมีความสำคัญมากที่ใช้เป็นเครื่องมือในการค้นหา information บนเว็บ เพื่อที่จะให้ได้
ประสิทธิภาพที่ดีนั้น search engines ต่างๆนั้นก็จะมี software agent ที่ถูกเรียกว่า web robot มันจะทำหน้าที่
ในการสะสมข้อมูลจากเว็บอย่างอัตโนมัติ web robot คือ โปรแกรมที่จะทำการสำรวจไปในเว็บและทำการวนรับ
ทุกๆเอกสาร เพื่อที่จะนำข้อมูลมาสร้างดัชนีในการค้นหาเว็บ
Focused Crawler เป็น web robot ประเภทหนึ่งซึ่งจะช่วยเหลือในการรับเพียงเว็บที่ซึ่งสัมพันธ์กับหัวข้อที่
กำหนดไว้ Focused Crawler จะทำการวิเคราะห์ link ที่มันพบและทำการกำหนดเส้นทางที่เหมาะสมที่จะนำไปสู่
หน้าที่มีความสัมพันธ์กับหัวข้อ
Metadata เป็นตัวกำหนดหรืออธิบายข้อมูล ในเว็บ Metadata ถูกใช้เพื่อจัดเตรียม information เกี่ยวกับ เอกสาร
และ เนื่อหาของ item ที่ซึ่งไม่จำเป็นที่จะต้องแสดงบนจอภาพ information เหล่านี้จะถูกเก็บอยู่ใน Metadata
ตัวอย่างเช่น ชื่อผู้เขียน วันที่สร้าง ลิขสิทธิ์ และ key word


Web mining สามารถแบ่งออกได้เป็น 3 ประเภท คือ

  • Web Content Mining

Web content mining คือประบวนการอัตโนมัติที่ซึ่งขยายรูปแบบจาก ข้อมูลแบบ online เช่น ไฟล์ html, รูปภาพ
หรือ e-mail ให้พร้อมที่จะใช้ keyword ในการดึง ข้อมูลนั้นออกมา

  • Web Structure Mining

Web structure mining คือ www สามารถที่จะแสดงให้เห็น information มากกว่า information ที่บรรจุอยู่ใน
เอกสาร เช่น link ชี้ไปยังเอกสารทำให้รู้ความนิยมของ เอกสารนั้น มันเปรียบได้กับ บรรณานุกรม เมื่อเอกสารนั้น
ถูกเรียกบ่อยมันก็จะมีความสำคัญมาก ซึ่ง pagerank method จะสามารถนำคุณสมบัตินี้ไปใช้ในการจัดระดับ
ความสำคัญได้

  • Web Usage Mining

Web server จะทำการบันทึกและสะสมข้อมูลเกี่ยวกับพฤติกรรมของผู้ใช้ เมื่อไรก็ตามที่มีการร้องขอสำหรับ
ทรัพยากรณ์ การวิเคราะห์ log ไฟล์ของ เว็บที่แตกต่างกันสามารถช่วยให้เข้าใจผู้ใช้ได้

My Chinchillas

posted on 15 May 2008 11:45 by m2byrd

edit @ 15 May 2008 13:06:04 by Byrd ja

คุณรู้มั้ย มืออาชีพ ต่างกับมือสมัครเล่นตรงไหน ?

  • มือสมัครเล่น จะทำงานไม่สำเร็จ แม้ว่าเค้าอยากจะทำงานนั้นมากแค่ไหนก็ตาม และมีเหตุผลร้อยพัน ว่าทำไมมันถึงไม่สำเร็จ
  • มืออาชีพนั้น จะทำงานสำเร็จเสมอ แม้ว่าเค้าจะไม่อยากทำงานนั้นๆเลยก็ตาม ไม่ว่าจะเบื่อหน่าย เหนื่อย ใดๆก็ตามแต่ งานจะเสร็จเสมอ แม้ว่าบางครั้งเค้าก็บอกเหตุผลไม่ได้เหมือนกัน

เริ่มจาก ' เรด เลเบิ้ล ' (Red Label) กันก่อนเลยดีกว่า
จอห์นนี่ วอล์กเกอร์ เรด เลเบิ้ล น่าจะดูถูกใจคนไทยที่สุด
เพราะน้องเล็กสุดขวดนี้ มี วัตถุประสงค์เพื่อการดื่มตลอดค่ำคืน
พูดง่ายๆ ก็คือกินได้นานๆ สนุกสนานกันทั้งคืนนั่นแหละ
แถมวิธีการกินที่ถูกต้องนั้น ก็ต้องผสมกับ ' มิกเซอร์ ' ทั้งหลาย
อันเป็นวิธีการดื่มที่นิยมในหมู่คนไทยอยู่แล้วซะอีก
ตอนนี้ จอห์นนี่ วอล์กเกอร์ เรด เลเบิ้ล ก็เลยขายดีที่สุดไปโดยปริยาย
ง่ายๆ จะใส่น้ำแข็ง ผสมโคล่า ชามะนาว หรือโซดาก็ได้ทั้งนั้น
สุดแล้วแต่ว่าจะชอบรสชาติแบบไหนหลังผสมมิกเซอร์แล้วเท่านั้นเอง
แต่นักดื่มมืออาชีพมักนิยมผสมน้ำก่อนแล้วจึงผสมโซดาตามลงไป
ในอัตราส่วน 2:1 หรือที่เรียกกันว่า " โซดาลอย " นั่นเอง ...
ผสมเสร็จก็ เอ็นจอย ดริ๊งกิ้ง กันได้ทั้งคืน ( แต่อย่าขับรถหลังดื่มนะ )

โตขึ้นมาหน่อย กับความเคร่งขรึมแบบ จอห์นนี่ วอล์กเกอร์ แบล็ค เลเบิ้ล
(Black Label)
วิสกี้ชั้นดีจากการหมักบ่มเพื่อให้ได้รสชาติที่คลาสสิกที่สุดนานถึง 12 ปี
วิธีการดื่มที่ถูกต้องนั้นก็คลาสสิกไม่แพ้รสชาติของตัววิสกี้
ง่ายๆ เท่ๆ ดูดีด้วยสไตล์ที่เรียกกันว่า ' ออน เดอะ ร็อก ' นั่นเอง
หรือถ้าอยากย๊ากอยากจะผสมมิกเซอร์เหลือเกิน
ก็ต้องใส่น้ำแข็งเข้าไปเยอะๆ วิสกี้ ครึ่งแก้ว และโซดาอีกครึ่งแก้ว
แค่นี้แหละ ก็จะได้สัมผัสรสชาติที่แท้จริงของ จอห์นนี่ วอล์กเกอร์ แบล็ค เลเบิ้ล

มาถึงวิสกี้ตระกูล จอห์นนี่ วอล์กเกอร์ ที่ไม่ค่อยจะเห็นบ่อยนักบ้างดีกว่า
เริ่มจาก จอห์นนี่ วอล์กเกอร์ โกลด์ เลเบิ้ล
(Gold Label) อายุ 18 ปีกันก่อน
แค่นำ จอห์นนี่ วอล์กเกอร์ โกลด์ เลเบิ้ล ไปใส่ในช่องแช่แข็งสัก 24 ชั่วโมง
ถ้าที่ในช่องแช่แข็งยังเหลือก็นำแก้วทรงสูงเปล่าๆ แช่ไว้ด้วย
พอได้เวลา ก้รินใส่แก้วที่แช่ไว ้ข้างกันๆ นั่นแหละ แล้วดื่มเข้าไปเลย
ทันทีที่วิสกี้เย็นจัดปะทะกับความอุ่นในปาก กลิ่นหอมหวนนุ่มลิ้นจะอบอวล
แหม...ยิ่งถ้ามีช็อกโกแล็ตดีๆ ไว้กินเข้าคู่ล่ะก็ จะเป็นความสุขที่ลืมไม่ลงเลย เชียว

ส่วน จอห์นนี่ วอล์กเกอร์ กรีน เลเบิ้ล
(Green Label) ที่มีจำหน่ายแบบจำกัดประเทศนั้น
หาน้ำแข็งก้อนใหญ่ๆ สักก้อน ใส่ในแก้วปากกว้างเพียงแค่ก้อนเดียว
ไม่ต้องกลัวว่าน้ำแข็งก้อนนั้นจะเหงา เพราะเราจะเฝ้ามองอย่าทะนุถนอม
จากนั้นริน จอห์นนี่ วอล์กเกอร์ กรีน เลเบิ้ล ลงไปไม่ต้องท่วมน้ำแข็ง
แกว่งแก้วเล็กน้อย ให้อุณหภูมิของวิสกี้ชะอุณหภูมิของน้ำแข็งก้อนโต
ดมกลิ่นวิสกี้ที่ระเหยขึ้นมาเล็กน้อย ก่อนลิ้มรสวิสกี้ที่อุณหภูมิพอเหมาะพอดี
งานนี้จะได้ รสชาติ กลิ่น และแสงที่วิสกี้ตกกระทบกับก้อนน้ำแข็งชวนมอง
( อันนี้เคยเสียของมาครั้งหนึ่งแล้ว )

ปิดท้ายกันที่วิสกี้ชั้นสูง จอห์นนี่ วอล์กเกอร์ บลู เลเบิ้ล
(Blue Label) อายุ 25 ปี
ที่หมักบ่มจากมอลต์คุณภาพสูง ตามวิธีการคลาสสิกแบบศตวรรษที่ 19
วิธีการดื่มวิสกี้ชั้นสูงนี้ก็คลาสสิกมาก เตรียมแก้วบรั่นดีสวยๆ ไว้สัก 2 ใบ
แก้วนึงรินวิสกี้รอไว้ ส่วนอีกแก้วนึงรินน้ำแร่เย็นๆ ไว้เช่นกัน
ดื่มน้ำแร่เย็นๆ เพื่อปรับอุณหภูมิในช่องปากกันก่อน
จากนั้นจิบ จอห์นนี่ วอล์กเกอร์ บลู เลเบิ้ล ในแก้วบรั่นดีอีกใบตาม
เมื่อน้ำแร่เย็นๆ ที ่หลงเหลืออยู่ในช่องปากผสมกับวิสกี้ชั้นดีนี้
รสชาติที่แอบซ่อนจะซึมผ่านเพดานปากไปมัดใจนักดื่มเหล้าทั้งหลายไม่รู้ลืม

เสร็จสิ้นครบทั้ง 5 เลเบิ้ลของตระกูล จอห์นนี่ วอล์กเกอร์ กันแล้ว
ต่อจากนี้นักดื่มเหล้าชาวไทยทั้งหลาย ก็จะดื่มได้แบบไม่เสียของกันแล้ว

 

 


 

มาทดสอบดูสิว่า คุณใช้สมองซีกไหนมากกว่ากัน


มันเป็นเรื่องของ “สมอง”

เป็นการทำนายว่าตอนนี้คุณใช้สมองซีกไหนมากกว่ากัน ซึ่งเป็นการทำนายในแบบญี่ปุ่น โดยดูจากการรับ-ส่งข้อมูลของแต่ละคน อาจจะตรงบ้าง ไม่ตรงบ้าง ก็ลองอ่านดูละกันนะ

เริ่มเลยละกันนะ...
สมองมี 2 ฝั่ง ใช่มั้ย?

สมองฝั่งขวา : มีหน้าที่จินตนาการ, เกี่ยวกับความรู้สึก, สัญชาตญาณ พูดง่ายๆ ก็คือ ถนัดการใช้จินตนาการ เก่งเรื่องศิลปะและคิดค้น มักทำอะไรโดยไม่รู้สึกตัว ว่ากันว่าสมองฝั่งขวาเป็นตัวควบคุมสัญชาตญาณ

สมองฝั่งซ้าย : มีหน้าที่คิดคำนวณ, วิเคราะห์, เหตุผล ก็คือ ถนัดด้านภาษาและคำนวณ คิดเป็นเหตุเป็นผล อิงกับวิทยาศาสตร์ คิดอะไรเป็นขั้นเป็นตอน จัดการทุกเรื่องอย่างรอบคอบ และใช้เหตุผลก่อน

ทีนี้เรามาเริ่มทดสอบดูว่าเพื่อนๆจะใช้สมองซีกไหนในการับ-ส่งข้อมูลกันบ้าง

Step 1 การประสานมือ : ความสามารถในการรับรู้ข้อมูลจากภายนอก ว่าใช้สมองฝั่งไหนรับข้อมูลกันแน่?
(การประสานมือ คือ การเอามือทั้ง 2 ข้างประกบกันเหมือนพนมมือ แล้วกำนิ้วมือลงมาให้นิ้วแต่ละข้างไปอยู่บนหลังมือของอีกข้างหนึ่ง ลักษณะเหมือนการอ้อนวอนพระเจ้าของศาสนาคริสต์ หรือคล้ายการเล่นวอลเล่ย์บอล)

Step 2 การกอดอก(กอด-อก) : ความสามารถในการส่งข้อมูลออกไป ว่าใช้สมองฝั่งไหนส่งข้อมูลกันแน่?


เรียบร้อยแล้ว มาดูคำแปลกันดีกว่า


- คนที่ใช้นิ้วหัวแม่มือข้างขวาทับอยู่ด้านล่างของนิ้วหัวแม่มือด้ายซ้าย คือ คนที่ใช้สมองฝั่งขวาเป็นหลักในการรับข้อมูล
- คนที่ใช้นิ้วหัวแม่มือข้างซ้ายอยู่ด้านล่างของนิ้วหัวแม่มือด้านขวา คือ คนที่ใช้สมองฝั่งซ้ายเป็นหลักในการรับข้อมูล

- คนที่เอาแขนขวาไว้ด้านล่าง คือ คนที่ใช้สมองฝั่งขวาเป็นหลักในการส่งข้อมูล
- คนที่เอาแขนซ้ายไว้ด้านล่าง คือ คนที่ใช้สมองฝั่งซ้ายเป็นหลักในการส่งข้อมูล

ผู้จัดการ(หัวหน้าโครงการ) กับโปรแกรมเมอร์(นักพัฒนาซอฟต์แวร์) แน่ใจหรือว่าอยู่ทีมเดียวกัน ???

สภาพโดยทั่วไปของหน่วยงาน IT ขององค์กร มักจะเจอสภาพแบบนี้อย่างคุ้นเคย ซึ่งหลายๆ คนก็คงจะเคยเจอด้วยตัวเองมา... ในโครงการหนึ่งๆ (ทั้งโลกเลยก็ว่าได้) จะเป็นที่รู้กันว่าระหว่างที่โครงการกำลังดำเนินไปนั้น มีเพียง user และ เหล่าผู้จัดการ ที่ไม่ได้ข้อมูลจริงเกี่ยวกับสถานะปัจจุบันของโครงการ (ทั้งที่ควรจะรู้ความจริง)

ทำไมจึงเป็นเช่นนั้น?

ปัญหาระหว่าง ผู้จัดการกับโปรแกรมเมอร์ คือ 'ความไว้วางใจ' เพราะผู้จัดการโดยทั่วไปจะไม่ไว้ใจโปรแกรมเมอร์ ว่าจะทำงานเสร็จตามเป้าหมาย เนื่องจากผู้จัดการเชื่อว่าโปรแกรมเมอร์ควรมีความกดดันในการทำงาน ไม่เช่นนั้นโครงการจะไม่เสร็จตามเป้าหมาย ส่วนโปรแกรมเมอร์เองก็ไม่ไว้ใจกับการบริหารโครงการ เนื่องจากโปรแกรมเมอร์ทั้งหลาย เชื่อว่าผู้จัดการจะเข้มงวดกับเค้า ถ้ารู้ว่ามีสิ่งผิดปกติเกิดขึ้น ผลลัพธ์คือ แทนที่ทั้งสองจะทำงานเป็นทีมเดียวกัน แต่กลับเหมือนทั้งสอง อยู่คนละทีม ด้วยต่างคนต่างปกป้องไม่ให้อีกฝ่ายมามีผลกระทบต่องานตัวเอง

เหตุการณ์ดังกล่าวจะทำให้โครงการทำท่าจะล้มเหลว การสื่อสารที่เหมือนมีกำแพงจะต้องหยุดลง

ดูจากรูปการ์ตูนในภาพแรกและภาพที่สองจะเห็นว่า การที่โปรแกรมเมอร์จะบอกความจริงของสถานะโครงการนั้น เพราะเค้าเชื่อว่าคนที่เล่าให้ฟังจะช่วยเหลือเค้าได้ แต่ในภาพที่สาม โปรแกรมเมอร์กลับพูดง่ายๆ ว่า 'Fine' (จะใช้คำว่า 'ก็เรียบร้อยดี')

จริงๆ แล้วโปรแกรมเมอร์ไม่ได้ใส่ใจ กับความหมายของคำว่า 'ก็เรียบร้อยดี' ที่พูดไปเลย เพราะเค้ารู้เพียงว่า ถ้าพูดถึงปัญหาเมื่อไหร่ เค้าก็จะถูกตำหนิเมื่อนั้น ที่จริงการสื่อสารแบบนี้มีความหมายต่อผู้จัดการว่า 'ผมไม่อยากคุยกับคุณ และอยากให้คุณออกโดยเร็ว'

ถ้าผู้จัดการต้องการพัฒนาความไว้วางใจระหว่างกันให้ดีขึ้นแล้ว อะไรจะดีไปกว่าการที่ผู้จัดการแสดงให้เห็นว่า เค้าอยู่เคียงข้างและเข้าข้างโปรแกรมเมอร์ เช่น ถ้ามีคนในทีมต้องการ RAM เพิ่ม ผู้จัดการควรพูดว่า 'ผมจะจัดหามาให้' หรือ 'ไม่มีงบประมาณแล้ว' ? หรือถ้าคนในทีมบอกว่าระยะเวลาในการพัฒนาน้อยไป ผู้จัดการควรพูดว่า 'ผมจะไปต่อรองลูกค้าและวางแผนใหม่' หรือ 'คุณมาทำงานในวันหยุดเพิ่มได้ไหม' ?

นี่เป็นเหตุผลที่ทำให้ผู้เขียนชอบกระบวนการพัฒนาแบบไม่เป็นทางการ (Agile Software Development) และชอบบทบาทของตำแหน่ง ScrumMaster (ScrumMaster คือ ผู้ที่แก้ไขหรือปกป้องปัญหาจากสิ่งภายนอก ไม่ให้เกิดขึ้นกับทีมของตน คล้าย Project Manager แต่แตกต่างที่ ScrumMaster จะคอยเป็นผู้สนับสนุนให้คนในทีมบริหารกันเองได้ราบลื่น บางเหตุการณ์ บางเวลาอาจจะคอยเป็นผู้นำหรือโค้ชบ้าง) แนวคิดกระบวนการการพัฒนาแบบ Scrum (Scrum คือ Software Methodology แบบ Agile ชนิดหนึ่ง ) จะพยายามอย่างมากที่จะให้ ScrumMaster เป็นส่วนหนึ่งของทีม เพื่อสนับสนุนสิ่งต่างๆให้ทีม ในทางกลับกัน เมื่อมีสิ่งผิดปกติเกิดขึ้น คนในทีมก็จะพูดถึงปัญหามากขึ้น เพราะคนในทีมคิดว่า ScrumMaster จะช่วยแก้ปัญหาให้เค้า มากกว่าจะมาตำหนิว่ากัน

edit @ 11 Mar 2008 18:16:46 by Byrd ja