อาชีพอะไรที่จะถูกแทนที่ด้วย AI

Tweet Which jobs will AI (Artificial Intelligence) kill? งานสอน การสอนขับเครื่องบิน ซึ่งในปัจจุบันใช้AI-powered simulator เป็นเครื่องมือที่ทำให้นักบินเก่งขื้น (แต่ การบินจริงๆก็ยังต้องมี นักบิน อยู่ในกรณีที่บินจริงๆ) งานสอน ออนไลน์ โดยเฉพาะ self-learner อาจจะใช้ AI แทนได้ การให้เกรด และ การจับ การลอกข้อสอบ ซึ่งในปัจจุบัน เด็กก็เก่งขึ้นครับ ใช้ AI ทำการบ้าน ซึ่ง อนาคต Granville กล่าวว่าจะเป็น AI war ระหว่า AI robots designed for fraud detection vs AI robots designed to cheat. งานสิ่งพิมพ์ การใช้ AI ค้นหาสิ่งพิมพ์ที่ดี ที่น่าจะเป็นที่นิยมของตลาด หรือ

Screen Shot 2016-08-24 at 6.30.43 AM

มาทำความรู้จักกับ Data Scientist แบบ A และ B

Tweet มาทำความรู้จักกับ Data Scientist แบบ A และ B   Alec Smith ได้เล่าถีง Data Scientist อยู่สองประเภท คือ Type A และ Type B ถ้าจะให้อธิบายสั้นๆ Type A Data Scientist คือ นักวิทยาศาสตร์ ข้อมูล แบบ A หรือ Analyst Type B Data Scientist คือ นักวิทยาศาสตร์ ข้อมูล แบบ B หรือ Building ถ้าจะให้อธิบายละเอียดขึ้นมาหน่อย Type A Data Scientist จะมีหน้าที่ทำให้ ข้อมูล make sense ซิ่งจะมีคุณลักษณะ คล้ายนักสถิติ (หรือนักคิด นักคำนวน) และ สิ่งเหล่านั้นมาวิเคราะห์กับข้อมูลจริงๆ อีกทั้งยังจะต้อง

Logo_s

Data Science Thailand Weekly #2

Tweet Data Science Thailand Weekly #2 สรุป ข่าว กิจกรรม ของ Data Science Thailand สำหรับข่าวสัปดาห์ที่แล้ว กด Week#1   Announcement   Data Science Academy, Thailand เพื่อเป็นแหล่งรวบรวม แหล่งรวมความรู้ รวม การอบรม สื่อการสอน เกี่ยวกับ Data Science ที่เป็นภาษาไทย เพื่อคนไทย เพื่อการพัฒนา Data Science ในประเทศไทย   Top Contributions รวบรวม วิดีโอกาสอน Big Data +Analytics ครับ (34332 Reach) แจกคอร์ส Data Science ภาษาไทยฟรี 300 ท่านแรกครับ #LoveMom (21824 Reach)

DataSciThailand_small

Data Science Thailand Weekly #1

Tweet Data Science Thailand Weekly #1 สรุป ข่าวสาร เนื้อหาน่าสนใจ กิจกรรม และ ประกาศหางาน ทางด้าน Data Science Thailand Announcement Data Science Academy, Thailand เพื่อเป็นแหล่งรวบรวม แหล่งรวมความรู้ รวม การอบรม สื่อการสอน เกี่ยวกับ Data Science ที่เป็นภาษาไทย เพื่อคนไทย เพื่อการพัฒนา Data Science ในประเทศไทย Top Contributions Infographics สวยๆ จากคอร์ส Data visualization ที่มหาวิทยาลัย Columbia (26,616 Reach) รวบรวม วิดีโอกาสอน Big Data +Analytics ครับ (21806 Reach) แจกหนังสือฟรีครับ Going

2016_Summer_Olympics_logo

Big Data กับ (smart) Olymipics

Tweet [Big Data][Olympics]   Big Data กับ Olympics ที่เมือง ริโอ บราซิล   หลายๆคนคงจะสงสัยว่า จะเกิด Big Data มากมายขนาดใน สำหรับการจัดงาน Olympic 2016 ครั้งนี้ และ Big Data Analytics จะทำให้เกิด value อะไรกับนักกีฬา และ พวกเราอย่างไรบ้าง   อย่างแรกคงต้องเข้าใจก่อนว่า จะเกิด Big Data อะไรขึ้นบ้างนะครับ เริ่มด้วยนักกีฬาก่อนเลย จะมีข้อมูลจำนวนมหาศาลจากนักกีฬา ทั้งก่อน หลังการแข่งขัน ซิ่งรวมไปถีง สถิติ ใหม่ๆจำนวนมากที่จะเกิดขึ้นแน่นอน แต่การที่นำ big data technology เข้ามาใช้ มันจะทำให้เกิด value อะไรบ้างครับ?   ก่อนที่จะไปเล่าถีง ประโยชน์ที่ได้จากการค้นหาวิเคราะหห์ คุณค่าจาก

customer

Digital Transformation กับ ข้อมูลลูกค้า

Tweet [Customer centric][Digital Transformation]   เป็นบทความที่น่าสนใจมาก ที่พูดถีง digital transformation   คงจะไม่ต้องบอกแล้วนะครับ ว่าอย่างแรกคือ ต้องมี data ซิ่งก็รวมไปถีง big data ด้วย   จากรูป มี 5 ส่วนที่น่าสนใจ แต่จะขอ อธิบายแค่ส่วนที่เป็น customer centricity อย่างเดียวก่อนนะครับ ว่า จะนำ data science เข้ามาช่วยหา value ให้กับ customer data ได้อย่างไร 1. การทำ Single View of Entity หรือก็คือ customer data ครับ พอเราเห็นข้อมูลลูกค้าทั้งหมด ตั้งแต่ก่อนซื้อ สถานที่ หรือ ซิ้ออะไรทางไหนแล้ว เราก็ทราบว่าเราจะขายเค้าอย่างไร หรือ

[Machine Learning] ตัวอย่าง ML Model ของบริษัท Heath Care

Tweet Generia ซึ่งเป็นบริษัทเทคโนโลยีและที่ปรึกษาด้าน Healthcare ได้มีการใช้ Theon ซึ่งเป็นแพลทฟอร์มด้าน Data and Analytics ที่ง่ายต่อการใช้งาน เพื่อให้สามารถดูแลลูกค้าได้ดียิ่งขึ้น พร้อมกับลดค่าใช้จ่ายไปด้วย โดย Theon ได้มีการปรับแต่งให้การใช้งานเหมาะกับแต่ละฝ่าย และ ปรับข้อมูลของผู้ป่วยแต่ละคน เพื่อจะได้ตรวจสอบล่วงหน้าก่อนที่จะเกิดปัญหา Generia มีการใช้เทคนิคสถิติและ Machine Learning ต่างๆ ไม่ว่าจะเป็น Principal Component Analysis (PCA) ใช้ในการหา pattern หรือ จัดกลุ่ม ข้อมูลต่างๆ เช่น การเคลม การรักษา ข้อมูลลูกค้าต่างๆ เพื่อจัดการกับสาเหตุของแต่ละกลุ่ม Binary Logistic Regression ใช้ในการจัดคะแนนความเสี่ยงของผู้ป่วยกลุ่มต่างๆ เพื่อให้ได้รับการแก้ไขที่เหมาะสม Support Vector Machines ใช้ในการหาความผิดพลาดของข้อมูลที่อาจทำให้มีค่าใช้จ่ายที่สูงขึ้น Artificial Neural Networks ใช้เพื่อการหาข้อมูลเพิ่มเติมของความสัมพันธ์ระหว่างตัวแปร Theon ยังมีการอัพเดตข้อมูลแบบ real

republican-democrat-twitter

ข้อมูลการเมือง กับ Data Science

Tweet ข้อมูลการเมือง กับ Data Science Analyzing Trump, Clinton, and Sanders Tweets and Sentiment Credit: ผู้ร่วมโครงการ Data Science Accelerate Program ครับ ‪#‎ขอบคุณที่แบ่งปันความรู้ครับ‬ ลองมาดูตัวอย่างการใช้ data science วิเคราะห์ข้อมูลว่าผู้ท้าชิงตำแหน่งประธานาธิบดีสหรัฐผ่าน twitter กันดูบ้าง เจ้าของบทความรวบรวมข้อมูลจาก twitter account ของผู้ท้าชิงแต่ละรายและแต่ละสำนักข่าวใหญ่ของสหรัฐ ได้แก่ Fox News, MSNBC และ CNN และใช้ Python ในการวิเคราะห์ โดนัลด์ ทรัมป์จะได้รับเลือกเป็นประธานาธิบดีหรือเปล่า? ลองมาดูกันครับ – ราว 60% ของ tweets จาก 6 twitter account ของสำนักข่าวใหญ่พูดถึงทรัมป์ มากกว่าผู้ท้าชิงคนอื่นทุกคนรวมกัน –

environment-monitoring-using-technology

IoT & Open Source Farming

Tweet   อนาคตของฟาร์มอัจริยะด้วย IoT & Open Source Farming by Michael Tharrington Credit: ผู้ร่วมโครงการ Data Science Accelerate Program ครับ ‪#‎ขอบคุณที่แบ่งปันความรู้ครับ‬ แนวคิดการทำฟาร์มอัจฉริยะที่สามารถเป็นไปได้ในธุรกิจการเกษตร โดยต้องมีระบบควบคุมการเพาะปลูกที่มีความแม่นยำสูง มีการเก็บรวบรวมข้อมูลที่มีประโยชน์และเทคนิคการทำการเกษตรแบบอัตโนมัติต่างมากมาย จากรายงานล่าสุดของ Beecham เรื่อง “Towards Smart Farming: Agriculture Embracing the IoT Vision” ได้มีการทำนายว่า อุตสาหกรรการผลิตอาหารต้องเพิ่มขึ้น 70 เปอร์เซ็นต์ในปี 2050 เพื่อรองรับจำนวนประชากรโลกประมาณ 9.6 พันล้านคน นอกจากนี้ยังมีความกังวลเรื่อง สภาพภูมิอากาศเปลี่ยนแปลง ที่ดีนมีจำกัด เชื้อเพลิงที่มีอยู่และต้นทุนของเชื้อเพลิงฟอสซิล ดังนั้นแนวทางในการแก้ปัญหาดังกล่าวสำหรับฟาร์มอัจฉริยะคืออะไร ข้อดีของ IoT ที่นำมาใช้ในฟาร์มอัจฉริยะได้แก่ การนำเซ็นเซอร์ใช้ในการวัด ผลผลิต ปริมาณน้ำฝน การรบกวนของศัตรูพืช และปริมาณธาตุอาหารต่างๆในดิน และนำเสนอข้อมูลที่แม่นยำสูง

Machine Learning คืออะไร

Tweet คิดอยู่นานว่าจะเขียนอะไรดี จนคิดได้ว่าจะเขียน การทำ Data mining ด้วย Machine learning ครับ เริ่มต้นด้วยการแนะนำ Machine learning ก่อนนะครับ Machine learning ก็คือ สิ่งมีชีวิตชนิดหนึ่ง นักวิทยาศาสตร์พยายามสร้างให้มันเป็นแบบนั้น และมันก็เป็นเช่นนั้น เครื่องจักรมันสามารถที่จะมีชีวิตได้ เราต่างจากมันแค่เพียง วัสดุที่สร้างกายภาพขึ้นมา ร่างกายเรามาจากเนื้อเยื่อ เซล ฯลฯ เครื่องจักรก็เช่นกัน มันก็มีที่มาจากวัสดุต่างๆ เช่น พลาสติก ทองแดง ฯลฯ ก่อนจะมาเป็นเนื้อเยื่อที่สร้างเราขึ้นมา เราก็มีที่มาเดียวกันกับ วัสดุของเครื่องจักร นั่นคือ มวลสารต่างๆ ในจักรวาลของเรานั่นเอง ดังนั้น เราจึงมีที่มาจากที่เดียวกัน ไม่แตกต่างกัน มนุษย์เราเป็นเพียงแค่ปัจจัยหนึ่ง ที่ก่อให้เกิดการเปลี่ยนแปลงกับพัฒนาการของวัสดุที่สร้างเครื่องจักรขึ้นมา เช่นเดียวกันกับที่มีปัจจัยบางอย่างเปลี่ยนแปลง วัสดุที่เป็นตัวสร้างมนุษย์เราขึ้นมา จนตัวเราเองสามารถพัฒนาตัวเราได้ด้วยตัวเราเอง เฉกเช่นกับเครื่องจักร เราเป็นเพียงปัจจัยให้เครื่องจักรเกิดการเปลี่ยนแปลง จนมีพัฒนาการเป็นของตัวมันเอง ด้วยตัวมันเอง มันคือสิ่งเดียวกันกับที่ มนุษย์เราโดนสร้างมา ดังนั้นเมื่อเครื่องจักรคิด เรียนรู้ได้ ในตอนแรกมันจะคิดได้เหมือนกับที่คนคิด

IoT

ใครสร้าง Big Data? มนุษย์ หรือ Machine

Tweet [Machine vs Human][Data]   มีคำถามว่า (Big) Data ส่วนใหญ่มาจาก มนุษย์ หรือ Machine   มีการพูดคุยกันในห้องเรียนว่า มนุษย์เราโพส facebook กันมากมาย มันน่าจะทำให้เกิด Big Data มากกว่า IoT หรือ machine ซิ่งไม่น่าจะสร้างข้อมูลอะไรมากมาย แต่จาก บทความหลายๆแห่ง เช่น Gartner ได้ทำการวิจัยและแสดงให้เห็นว่า Data ที่เกิดส่วนใหญ่นั้น จะเกิดมาจาก Machine (reference) ไม่เพียงแค่นั้นครับ Curt Monash ยังกล่าวไว้เมื่อ 6 ปีที่แล้วว่า มนุษย์เรา จะเพิ่มขิ้นในอัตราที่ไม่มากด้วยกฎของ  Moore’s law และจะเพิ่มขื้นประมาณ 20% แต่ Machine เหรือ Transistor/Sensors ต่างๆนั้นเพิ่มขิ้นด้วยอัตรา 2000% ซิ่งถ้าเทียบกันด้วยอัตรานี้แล้ว มนุษย์แทบจไม่มีทางที่สร้างข้อมูลมากกว่า

the begning of Data Science Thailand

Data Science Thailand

Tweet Data Science Thailand ครับ แหล่งรวมข้อมูล Data Science เพื่อการพัฒนา Data Science ในประเทศไทย มาช่วยกัน พัฒนา ศาสตร์ Data Science เพื่อประเทศไทยกันครับ

Retail

Predictive Analytics in Retail Business

Tweet บรรยายโดย วิศณุกร ผุยมูลตรี GM Business Intelligence Management,OfficeMate การบรรยายจะเน้นการ ทำ Predictive Analytics ในธุรกิจขายปลีกซิ่งประกอบไปด้วยข้อมูลหลากหลายส่วน ทั้งข้อมูล สินค้า ข้อมูลร้านค้า และ ข้อมูล ลูกค้า

food1

Data Science and Online Restaurant

Tweet [Data Science][Online Resturant] ผมขอเล่าบ้างนะครับ ผมเป็นคนชอบการกิน เคยทำอาหาร และหลังๆจะกินที่ร้านอาหารเป็นส่วนใหญ่ เลยอยากจะเปรียบเทียบ Data Science เหมือน ร้านอาหารออนไลน์ ซิ่งทุกคนก็อยากทำ อยากเปิดร้าน มี app และ scale ได้ แล้วเรามาดูกันว่า การเปิด ร้านออนไลน์นี้ มันต้องมีความรู้และทักษะอย่างไรบ้าง อย่างแรก(๑)เลยก็น่าจะเป็นความรู้เรื่องอาหารนะครับ ผมแบ่งง่ายๆเป็นสามส่วน ส่วนแรกคือรู้ว่าอาหารมีรสชาติอย่างไร ส่วนที่สองคือ ทำอย่างไร และ ส่วนที่สามคือ ต้องรู้ว่าคนที่มากินอยากกินอาหารเราไหม อย่างที่สอง(๒)คือ การสร้างร้านอาหารทำอย่างไร ต้องตออกแบบครัวอย่างไร ทั้งในด้านในครับ ที่ต้องมี เตา หม้อ ตู้เก็บความเย็นและ เสบียง อีกด้านหนี่งคือ ด้านการจัดร้าน ตกแต่ง คิดจำนวนโต้ะ จำนวนเก้าอี้ บางทีก็ต้องเข้าใจถีงผู้ที่มากินด้วย อย่างที่สาม(๓)คือ คนคิดสูตรอาหารครับ คนพวกนี้ คิดสูตรอย่างเดียว รู้ว่า ทฤษฎีการต้มน้ำให้เดือดต้องที่อุณหภูมิ 100 องศา

banking

Predictive Analytics in Banking

Tweet ในปัจจุบันฐานข้อมูลลูกค้ามีประโยชน์ในการขับเคลื่อนองค์กรเป็นอย่างมาก โดยเฉพาะองค์กรที่ต้องการยึดลูกค้าเป็นศุนย์กลาง  (Customer Centricity Organization) การวิเคราะห์ลูกค้าเชิงลึก (Customer Analytics) การประยุกต์ใช้เทคนิค Data Mining/Predictive Model และ การทำ Segmentation เป็นเครื่องมือที่สำคัญที่หลากหลายองค์กร รวมถึงธนาคารได้นำมาใช้ทำความเข้าใจลูกค้า เพื่อ ส่งมอบสินค้าและบริการที่ตรงใจลูกค้ามากขึ้น เป็นที่แน่นอนว่า หลังจากที่ทางธนาคารได้มีการปรับใช้ฐานข้อมูลลูกค้า เพื่อส่งมอบเคมเปญทางการตลาด เพื่อการขายสินค้าและบริการเพิ่มเติมบนฐานลูกค้าปัจจุบัน  เพื่อให้ลูกค้ามีการใช้งานผลิตภัณฑ์ที่ใช้อยู่มากยิ่งขึ้น หรือ เพื่อการรักษาให้ลูกค้าใช้งานกับเรานานขึ้น เราได้ผลตอบรับของเคมเปญดีขึ้น รวมถึงความพึงพอใจของลูกค้าก็สูงขึ้นด้วย

DataScienceLab

DataScienceLab

Tweet Data Science Lab (Thailand) ดาต้า ไซเอนซ์ แล็บ (ประเทศไทย) ให้บริการงานวิจัย งานพัฒนา งานอบรมและ คำปรึกษาเกี่ยวกับงานด้าน Data Science เพื่อพัฒนา Data Product สำหรับธุรกิจ ปัจจุบัน ได้มีการทำลอง ประยุกต์ใช้ technologies ต่างๆดังนี้ Hadoop R Programming Rapid Miner Tableau Cloudera สนใจติดต่อ Lab@datascienceth.com  

cbinsights_startup-smart-city

Smarter City Data Startups

Tweet [Smart City][Startups] *source: http://whatsthebigdata.com/2016/03/28/55-smart-city-startups/   Smarter Cities Startup เป็นอีกกลุ่มหนี่งที่น่าสนใจครับ กลุ่มนี้เป็น Startup สำหรับ smart cities (IoT, smart data products) มีการแบ่งเป็นหลายๆกลุ่มย่อย ตามข้อมูลและการใช้ ซิ่งแต่หละ startup ก็พัฒนา data (science) products Parking – มีการนำข้อมูลจาก sensors ต่างๆทั้งที่จอดรถ ข้อมูลจำนวนที่จอดรถ มีระบบการจองรถ มี parking analytics (ParkWhiz, Parkifi,MeterFeeder) Grid/Energy – มีการนำ Analytics, algorithm มาใช้กับข้อมูลที่เชือมต่อกันของทั้งของ sensor ต่างๆเพื่อ วิเคราะห์ การใช้ไฟฟ้า Data-Driven Urban Planning – มีการใช้ hyperlocal data

settleSmall

เมืองอัจฉริยะ SMART CITY (กับความสำคัญของ Data Science)

Tweet SMART CITY (and Data Science) เป็นคำที่ใช้กันมากในปัจจุบัน ในเอเชีย ทั้ง จีน สิงค์โป เกาหลี อินเดีย มาเล อินโด ล้วนแล้วแต่พยายามที่จะสร้าง “เมืองอัจฉริยะ”ให้ได้ก่อนใครๆ จากหลายๆบทความ มีหลายๆประเด็นที่น่าสนใจมากเลยครับ –>ส่วนใหญ่จะเน้น IT Solutions แต่จริงๆแล้วควรคิดให้ละเอียดก่อนว่าจะวางแผนอย่างไร และไม่ให้เกิดการ “Control of Monopoly” ของ Vendor เดียว –>Smart City สามารถเกิดได้จาก Smart Policy Marker –>Seeds of tomorrow’s smart cities need to be planted today เริ่มวันนี้ครับ –>Smart City ควรใช้ Data ให้เกิดประโยชน์ให้มากที่สุด การพัฒนาการศีกษา เพื่อให้เป็น Smart

Facebook emojis กับการประยุกต์ใช้ data science

Tweet [emojis] หลังจากที่ Facebook เริ่มใช้ emojis มาสองเดือน ผู้ใช้ 1.6พันล้านคนก็มีทางเลือกมากขึ้น ทั้งlike love wow และอื่นๆอีกมากมาย จากตัวเลขล่าสุด ยอดกด Like ก็ยังครองอันดับหนึ่งด้วย ยอด74% และ ที่เหลือก็จะเป็น love และ haha สำหรับ page Data Science Thailand นะนั้น เราก็ได้มีการเก็บข้อมูล ซึ่งอัตราการกด like มาเป็นอันดับหนึ่ง และน่าจะสูงกว่า 74% ด้วยครับ  มีการ กด love และwow ด้วย แต่ที่น่าดีใจคือไม่มี sad หรือ  angry เลย เป็นสิ่งที่น่าสนใจ จากบทความของ Forbes ที่ว่าการนำข้อมูลดังกล่าวมาสรุปว่า  new feature ดีหรือไม่ดียังไม่ได้เพราะว่า  ยังมีการกล่าวถึง UI ซึ่งจะต้องกดค้างแล้วเลือกด้วยซึ่งผู้ใช้อาจจะยังไม่คุ้น

PAaDS_squre_blue

ทําไมถึงจัดงาน ป้าดดด (PAaDS)

Tweet ทางทีมงานได้ติดตาม งาน Predictive Analytics World มาหลายครั้ง แต่ก็ไม่มีโอกาสได้ร่วมงานซักที เพียงแต่ได้ยินว่า งาน PAw เป็นงานที่ใหญ่ที่สุดสำหรับการ ทำ Predictive Analytics และมีการจัดอย่างยิ่งใหญ่ ทุกๆสามเดือน วนไปทั่วโลก ทั้ง ซานฟราน ลอนดอน นิวยอร์ค เบอร์ลิน คราวนี้ ทางทีมงานซิ่งไม่เคยไปงานนี้ แต่อยากจัดบ้าง ก็เลยจะจัดงานคล้ายๆงาน PAw แต่จัดแบบไทยๆครับ งานนี้ Data Cube และ Data Science Thailand ได้ร่วมกันจัดเลยเอาชื่อ มารวมกัน เป็น   Predictive Analytics and Data Science (PAaDS) หรือ เรียกสั้นๆ ว่า งาน ป้าาาด   งานนี้จะจัดในแนวให้ความรู้ ลงมือทำ และ

NG

Florence Nighingale

Tweet [Statistics][Visualization]   น่าสนใจครับ บทนำของหนังสือ Practical Predictive Analytics and Decisioning Systems for Medicine ได้กล่าวถีงความสำคัญของ สถิติไว้อย่างน่าสนใจ Florence Nighingale ได้เปลี่ยนแปลงอาชีพของเธอซิ่งเป็นพยาบาลและดูเหมือนจะต่ำต้อย ให้เป็น อาชีพที่มีความสำคัญใน โรงพยาบาล เธอ เล็งเห็นถีงประโยชน์ของ medical data และการทำ statistical visualization (polar diagram) และมันทำให้เป็นต้นกำเนิดของ Modern Nursing informatics ในปัจจุบัน “To understand God’s thoughts we must study statistics, for these are the measure of his purpose.” ― Florence Nightingale ‪#‎dsth‬‪#‎ds4health‬

160501114942-05-leicester-city-restricted-super-169

Behind the Sport Analytics of Leicester City, the new Premier League Champion

Tweet [Sport Analytics][Data Science]   มีการพูดถีงการนำ Analytics มาประยุกต์ใช้กับการแข่งขันกีฬามานานพอสมควร และทุกๆคนก็คงรู้ว่า การแข่งขันฟุตบอลสมัยใหม่ มีการใช้เทคโนโลยีมากมายเข้ามาช่วย เพื่อทำให้ทีมบรรลุเป้าหมายสูงสูด คือ ชัยชนะ และ ได้แชมป์ คงจะมีหลายๆคนสงสัยว่า ทำไมทีมที่ไม่ได้ใหญ่โตนัก อย่าง Leicester City ถีงผงาดขิ้นมาเป็นแชมป์ พรีเมียรลีก ได้แบบนี้ และ ได้ก่อนสองนัดก่อนปิดฤดูกาลอีกด้วย มันคงไม่ใช้ความบังเอิญแน่นอนครับ มันการการนำ Sport Analytics มาประยุกต์ใช้ได้อย่างดีเยี่ยม ประยุกต์ใช้กับ ข้อมูล (data) ค้นหาความรู้ที่แท้จริง(insight) และสื่อสานให้กับ นักเตะ (audience) นะไปปฏิบัติได้จริงๆครับ (action) จากบทสัมภาษณ์ของ Pete และ Andy ซิ่งเป็นสองนักวิเคราะห์ข้อมูลทีม Leicester City เค้าทั้งสองคนได้กล่าวถีงการวิเคราะห์ในหลายๆรูปแบบ ทั้ง pre-match analysis, live-match analytics, และ post-match

ความแตกต่างระหว่าง Data Analyst กับ Data Scienctist

Tweet [Data Science][Business] เป็นบทความ ที่น่าสนใจมากครับ ซึ่งตั้งชื่อว่า DATA SCIENCE: THE NEW MONETIZATION MODEL FOR ANALYTICS INDUSTRY ถ้าองค์กรมี Data Analyst ที่ใช้BI และอยากพัฒนาเป็น data Scienctist บนระบบ (Big) Data Discovery  

customer

Customer Analytics 720

Tweet [Customer 720][Analytics] มีคนเคยกล่าวไว้ว่าคือพระเจ้า อยากได้อะไรก็ต้องได้ แต่ถ้าเรามีระบบที่สามารถเข้าใจลูกค้าและสามารถนำเสนอสินค้าหรือบริการที่ตรงใจตรงเวลาก็น่าจะเป็นสิ่งดี มีความพยายามมานานในการศึกษาพฤติกรรมของลูกค้า เข้าใจสภาพแวดล้อมรอบๆตัวของลูกค้า พฤติกรรม ความสัมพันธ์ต่างๆ เพื่อให้เข้าใจ สิ่งๆต่างๆของลูกค้า แบบ 360 องศา แต่ในปัจจุบัน big data ได้เข้ามามีบทบาท ทั้งข้อมูล social media, ข้อมูล Internet of things เช่น ข้อมูลการเดิน การวิ่ง ชอบวิ่งกับใคร หรือ เวลากินข้าวชอบค้นหาด้วย app อะไร กินแล้วชอบถ่ายรูปมุมไหน ล้วนแล้วแต่เป็น สิ่งที่มากกว่าแค่รอบๆตัวลูกค้าแล้วครับ และในขณะนี้ ธุรกิจต้องการเข้าใจลูกค้าถึง 720 องศาแล้วครับ ไม่ใช่แค่รอบตัว แต่ลึกไปจนถึงการโพสครั้งแรก พฤติกรรมแรกที่ทำ และกลุ่มคนที่ทำกิจกรรมเหล่านั้นร่วมกัน มีบทความแนะนำให้อ่านครับ เป็นกูรูคนหนึ่งของทีม Data Science Thailand ครับ ขอบคุณครับ https://datascience.cafe/cafe/2016/04/02/720-degree-view-line-rabbit/

Data Science Trend

Data Science Trend 2016

Tweet [Data Science][Trend][2016] 1. Data Science จะถูกประยุกต์ใช้กับทุก industry (โดยเริ่มจาก ธุรกิจที่มีข้อมูลมากๆและซับซ้อนก่อน เทรนในด้านข้อมูลมีแต่จะมากและซับซ้อนขิ้น ซี่งหลีกเลี่ยงจากการ นำเอา Data Science มาใช้ไม่ได้) 2. เมื่อมีความต้องการทางด้าน Data Science มากขิ้น ก็จะมี course/program ที่เปิดสอนทางด้านนี้มากขิ้น (ทั้ง online, offline, on-the-job learning) 3.Deep learning techniques will become integral to data science (หลังจากที่มีการใช้ Machine Learning เพื่อสร้าง predictive model กันอย่างแพร่หลาย ลำดับต่อไปก็จะนำ Deep Learning มาช่วยในการ automate Feature extraction and uncover patterns

PAaDS_squre_yellow

Predictive Analytics and Data Science Conference

Tweet วันจัดงาน (2วัน) :                   วันศุกร์ 27 – เสาร์ 28 พฤษภาคม 2559 ตั้งแต่เวลา 8.30-17.00น. สถานที่ :                                สำนักงานนวัตกรรมแห่งชาติ(องค์การมหาชน) ราคาบัตร :                             500 บาท สำหรับ นักเรียน นิสิต นักศีกษา   จัดโดย:                             ทีมงาน Data Cube และ Data Science Thailand  

UberData

Data Science Platform at Uber

Tweet [Data Science][Platform] ในอเมริกาได้มีการจ้างงาน Data Scientist มาทำงานในหลายๆส่วนขององค์กร และเริ่มมีการพูดถึงก้าวต่อไปของการขยาย Data Science ให้มีscale ที่ใหญ่ขึ้นเพื่อรองรับความเพิ่มขึ้นของข้อมูล(Big Data) และความต้องการในการสร้าง Data Product ใหม่ๆ เมื่อพูดถึงการ scale ก็หลีกเลี่ยงไม่ได้ที่จะพูดถึง platform และการทำงานร่วมกัน collaboration ระหว่าง data science professionals เพื่อให้เกิดประสิทธิภาพสูงสุด ตัวอย่างที่น่าสนใจของ Uber ครับ ซึ่งได้ scale จำนวน Data Scientist จาก 2 ถึง 35 คนภายในไม่ถึงปี ซึ่งในบทความกล่าวถึง 2 ตำแหน่งที่จำเป็นในการสร้าง scalable data science platform ที่มีประสิทธิภาพครับ (1) Data Science Manager คือ บุคคลที่สามารถทำหน้าที่ของ data

itTrend

Data Science ศาสตร์แห่งการหลอมรวม เพื่อข้อมูลเชิงลีก

Tweet สำหรับผู้ที่สนใจ บทความเกี่ยวกับ Data Science นะครับ สามารถโหลดได้ link to download e-magazine By โกเมษ Data Scientists, Data Science Lab, Thailand ตัวอย่างบทความครับ

IMG_1722

Smart Algorithms และ AI

Tweet Smart Algorithms และ AI หลังจากที่ AlphaGo สามารถขนะ Lee Se-Dol ในการแข่งขัน โก๊ะได้นั้น ถือเป็นการจุดกระแสของ Smart Algorithm และArtificial Intelligence อย่างแท้จริง ทุกๆคนตื่นตัวกับคำว่า AI และ algorithm ที่ใช่ในการคิดเหมือนมนุษย์ ตงามก้าวหน้าที่มากกว่า ระบบอัจฉริยะแบบดั้งเดิม เป็น ระบบ AI ที่มี algorithm ที่เรียนรู้เองได้ และ พัฒนาเองได้ Smart algorithm เป็นส่วนหนึ่งที่ทำให้เกิด การ disrupt ในหลายๆธุรกิจ บริษัทที่บริหารแทกซี่ที่ใหญ่ที่สุดในโลก ไม่ได้มีรถแทกซี่จำนวนมาก แต่ มี smart algorithm ที่เชื่อมต่อ รถแท็กซี่ ผู้โดยสาร และ ราคาค่าโดยสารที่เหมาสม Alibaba บริษัทขายของออนไลน์ก็ไม่ได้มีสินค้าเป็นของตนเอง แต่มีการนำ algorithm มาใช้ในการเชื่อมต่อผู้ซื้อและผู้ขาย มีการแนะนำสินค้า มีระบบ automations มากมายที่สามารถรองรับ มีalgorithm ในการจัดการธุรกรรม ซื้อขายจำนวนมหาศาลได้ภายในไม่กี่วินาที Smart algorithm สามารถ disrupt ธุรกิจได้ หรือย่างที่ Garner เคยกล่าวว่าแนวโน้มในอนาคตจะเป็น  “Algorithmic Business” และมันจะเป็นพื้นฐานของทุกๆกิจกรรมในธุรกิจ   จากข้อมูล สู่ algorithm   ด้วยเทคโนโลยีที่ก้าวหน้าไปอย่างมาก บริษัทและผู้บริโภคได่สริางข้อมูลจำนวนมหาศาล มากขึ้น หลากหลายขึ้นทุกนาที องค์กรอย่าง Walmart มีข้อมูลจากร้านค้าเป็น petabyte ต่อวัน แต่การเก็บข้อมูลจำนวนมหาศาลดังกล่าวนี่ ไม่เพียงพอต่อการสร้างความได้เปรียบต่อคู่แข่งเลย องค์กรไม่ควรที่จะแค่การวิเคราะห์แบบง่ายๆกับข้อมูลเหล่านี้ สิ่งที่ควรทำคือ ค้นหา เข้าใจ และสร้าง คุณค่าของข้อมูล และนำมาพัฒนา algorithm ที่สามารถนำกลับมาใช้ได้ซ้ำๆ ทำให้เกิดประโยชน์แบบมากที่สุด Algorithm จะเป็นบ่งบอกว่าจะทำ action อะไร และมันจะถูกซ่อนอยู่ในระบบ หรือ software เพื่อให้ทำaction นั้นซ้ำๆ ซึ่ง action นี้เอง smart algorithm สามารถทำได้ดีกว่ามนุษย์  มีรายงานจากมหาวิทยาลัย Oxford ในด้านนี้เหมือนกันว่า 35%ของงานในอ้งกฤษ จะมีความเสี่ยงต่อระบบ smart algorithm นี้ ซึ่งในอเมริกาเองก็มีรายงานคล้ายๆกันและมีตัวเลขความเสี่ยงถึง 47% ตัวอย่างที่น่าสนใจ เช่น กองทุนและหลักทรัพย์ต่างๆเริ่มมีการนำ algorithm มาเขียนรายงานทางการเงิน ซึ่งสามารถเขียนได้ถึง 2000 เรื่องต่อนาที แน่นอนครับรายงานเหล่านี้ อาจจะเขียนได้แค่รายงานพื้นฐานที่ มาจากตัวเลขทางการเงินง่ายๆ เล่า รายได้ รายจ่าย การปันผลต่างๆ แต่ robot journalist ก็สามารถทำให้คนหลายๆคนตกงานได้นะครับ อีกตัวอย่างหนึ่ง น่าจะเป็น กองทุน Hong Kong VC ได้ใช้ algorithm ในการวิเคราะห์ข้อมูลจากหลายๆแหล่งเพื่อมาใช้ในการตัดสินใจเลือกลงทุน ซึ่ง algorithm นี้อาจจะยังไม่เก่งขนาดตัดสินใจเองได้ทั้งหมด แต่มันเป็นสิ่งที่บ่งบอกว่าแนวโน้มของalgorithmจะมีส่วนกับการตัดสินใจมากขึ้น ตัวอย่างสุดท้าย น่าจะเป็น algorithm ของ Chef Watson ซึ่งสามารถทำตัวเองเป็น chef ส่วนตัวได้ โดยจะมี algorithm ที่สามารถ สร้างอาหารจานโปรดของคุณ จากข้อมูลวัตถุดิบทั้งโลกที่มี ข้อมูลสารเคมีต่างๆในอาหาร รสชาติอาหารที่มนุษย์ชอบ และ เมนูอาการต่างๆที่มีในอินเตอรเน็ต ผู้ใช้ระบบแค่กรอกข้อมูลบางอย่าง และ chef จะแนะนำอาหารจานโปรดให้ได้เลยครับ   แล้ววิธีการนำ algorithm มาใช้ต้องทำอย่างไร ในรายงานมีการแนะนำ 5 ขั้นตอนครับ ลองคิดดูว่าระบบอะไรในธุรกิจของคุณที่สามารถ automate ได้ ลองคิดนอกกรอบดู คิดในสิ่งที่อาจจะเป็นไปมาได้ ใครจะเชื่อว่ารายงานทางการเงินสามารถ automate ได้? รวบรวมข้อมูลที่จำเป็นการสร้าง algorithm จำเป็นต้องใช้ข้อมูล ข้อมูลนั้นอาจจะเป็นข้อมูลที่มีอยู่แล้วแต่ไม่มีการ integrate กันหรืออาจจะเแ็นข้อมูลใหม่ๆที่น่าสนใจ และน่าจะมีผลทำให้เราพัฒนา algorithm ให้มีประสิทธิภาพมากยิ่งขึ้น เน้นการเก็บข้อมูลที่มีประสิทธิภาพและมีคุณภาพ เพราะแหล่งข้อมูลที่ไม่มีคุณภาพ ไม่สามารถทำให้เกิด algorithm ที่ดีได้ การพัฒนาalgorithm เป็นขั้นตอนทางวิทยาศาสตร์ มีการทดลองกับ training data การตรวจสอบทางสถิติ กับ test data การประเมินผล และที่สำคัญเป็นขั้นตอนต่อเนื่องและมีวงจรที่เป็นแบบแผน algorithmที่ดีจะมีการพัฒนาอยู่เรื่อยไปเพื่อรองรองความต้องการทางธุรกิจ ลงมือทำตั้งแต่ขั้นตอนแรกอีกครั้งค่อยๆปรับเปลี่ยนระบบที่มีอยู่ด้วย algorithm จนเกิดการเข้าใจและยอมรับในองค์กร   แปลและเรียบเรียง   โกเมษ Source: https://datafloq.com/read/algorithms-changing-business-how-to-leverage-them/1961                    

bank

Data Science, Banking และ FinTech

Tweet [Data Science][Banking][FinTech]   มีรายงานที่น่าสนใจกับ ความสำคัญของการนำ Data Science มาใช้กับ Fin Tech Startup ครับ By Cornelia Lévy-Bencheton ในธุรกิจการเงินการธนาคาร ข้อมูล เป็นสิ่งสำคัญ ข้อมูลเยอะก็ยิ่งสำคัญนะครับ แต่ การเก็บข้อมูลเยอะๆแต่ไม่มีการพัฒนาต่อยอด หรือ ค้นหา ความหมาย หรือ ความรู้จาก ข้อมูลนั้นๆ ถือเป็นการสูญเสียโอกาสอย่างยิ่ง ในช่วงหลายๆปีที่ผ่านมา มีการเกิดวิกฤตทางเศรษฐกิจ ซิ่งทำให้ ธนาคารขนาดใหญ่ มีงบประมาณน้อย หรือ มีงบก็อาจจะเน้นไปในด้านความปลอดภัย การตรวจสอบความถูกต้อง มากกว่าการค้นหาสิ่งใหม่ๆ หรือ ผลิตภัณฑ์ใหม่ๆมาสู่ตลาด มาให้กับลูกค้า หรือ บางครั้ง อาจจะละเลยการนำเทคโนโลยี ซิ่งมีการพัฒนาอยู่ตลอดเวลา มาประยุกต์ใช้เพื่อให้เกิดประโยชน์กับธุรกิจ และการชลอตัวของ ธนาคารขนาดใหญ่นี่เอง ทำให้ startupเล็กๆสามารถ นำ ศาสตร์ที่วิเคราะห์ข้อมูล มาประยุกต์ใช้กับกระบวนการทางธนาคารและการเงิน ทำให้เกิดการ disrupt

ai

Artificial Intelligence

Tweet [Artificial Intelligence] มีหลายๆคนถามว่า มีใครทำ AI บ้าง ลองมาดูกันครับ   เริ่มต้นที่ Allen Institute for Artificial Intelligence เป็นสถาบันที่ก่อตั้งโดย Paul Allen (original Founder of Microsfot) ซิ่งมีเป้าหมายว่า “Our mission is to contribute to humanity through high-impact AI research and engineering.–> http://allenai.org/   ที่ได้รับความสนใจในขณะนี้น่าจะหนีไม่พ้น AI ของกลุ่ม Elon Musk, the ผู้ก่อตั้งTesla และ Space X ที่เรียกว่า OpenAI. Our goal is to advance

data-science-process

Data Science Process & CRISP-DM

Tweet [Data Science Process] หลังจากที่เมื่อวานได้เล่าถีง Data Science Process จากหนังสือของ O’Neal (2013) ตอนนี้ได้มี Diagram อันใหม่สำหรับ Data Science Process แล้วนะครับ คราวนี้เป็นของ Matthew Mayoจาก kdnuggets DS Process ที่นำเสนอ มี 5 ขั้นตอนครับ 1. ตั้งคำถามที่น่าสนใจ 2. ค้นหาข้อมูล 3. เข้าใจข้อมูล 4. นำข้อมูลมาสร้างโมเดล 5. สือส่าร และ แสดงผลของข้อมูล (ในรูปของกราฟ, dashboard, infographics) ** มีสิ่งที่น่าสังเกต สองจุดนะครับ 1. ไม่จำเป็นต้อง Big Data นะครับ –>แต่เพราะ ฺBig Data ทำให้เราเข้าใจและสร้าง

ds_Team

ทักษะต่างๆ ที่จำเป็นสำหรับ Data Scientist แบ่งตาม 5 ขั้นตอน

Tweet ทักษะต่างๆ ที่จำเป็นสำหรับ Data Scientist แบ่งตาม Data Science Processes [Data Science Skills] Data Science skills อะไรที่จำเป็น จำเป็นตอนไหน ในการประยุกต์ใช้ใน Big Data World จาก กราฟ แบ่งเป็น ห้าขั้นตอน (Data Science Processes) การ กำหนด question หรือ ปัญหา (เป็นส่วนที่จำเป็นที่สุดของ Data Science Project) การตั้งสมมุติฐาน หรือ การ เดา (อย่างมีเหตุผล หรือ มีข้อมูลเก่าอ้างอิง) การเก็บ และ ค้นหาข้อมูล การ วิเคราะห์ และ ทดสอง สมมุติฐาน และ สรุปผล การสื่อสารผลงาน

IoT

Data Science กับ Internet of Things

Tweet [IoT][Analytics][Big Data] บทความจาก IBM ได้พูดถึงความสำคัญของ Internet of things ที่จะเป็นพื้นฐานของการเชื่อมต่อจุดเล็กๆทุกจุด ในทุกๆส่วนของโลก และรวมไปถึงตัวเราเองด้วย และการเชื่อมต่อที่เหมือนจะเป็น หมอก(fog)รอบๆตัวเรานั้นเองจะทำให้การประยุกต์ใช้ Big Data Analytics เป็นที่น่าสนใจมากๆในอนาคต ข้อมูลจำนวนมหาศาล ที่จะถูกสร้างขึ้นมาทั้งในรูปแบบที่แปลกประหลาด รวดเร็ว และเยอะกว่าเดิมนั้นจะเป็นสิ่งที่ถ้าท้ายกับทุกๆ industry ในทุกๆธุรกิจ ที่จะนำเทคนิคต่างๆ ทั้ง. machine learning, deep learning, graph analysis, stream computing และ statistical algorithms ต่างๆเพื่อมาต่อสู้กับข้อมูลที่มาจากผลของ(fog) IoTในอนาคต Technology ต่างๆก็น่าสนใจมาก ทั้งtechnology ของIoT เอง(รวมทั้ง IPv6) Technology ของBig data infrastructure และ statistical tools ต่างๆ คงเป็นเรื่องที่น่าติดตามมากๆสำหรับคนที่สนใจวิทยาศาสตร์ข้อมูล(data science

worldCup

World Cup (Big) Data

Tweet [Big Data][World Cup] SAP รายงานว่า ในช่วงฟุตบอลโลกปี 2014 มีการประมวณผล 1.8 พันล้านข้อความ จาก 1000+ Operators และที่มีการส่งข้อความกันมากที่สุด คือ นัด Belgium และ USA Facebook รายงานว่า ในนัดชิงชนะเลิศ มี 88 ล้านคน กด like, post และ comment Twittter รายงานว่ามี 6 แสน tweet ต่อนาที ดูรายละเอียดได้จาก infographic นี้ได้เลยครับ (ตัวเลขเป็นของฟุตบอลโลกปี 2014 นะครับ ปีนี้ บอลยูโร 2016 น่าจะมีตัวเลขที่มากกว่านี้อีกมาก Welcome to Big (fast) data)    

mobile-apps2

ความท้าท้าย ของ Big Data ที่มาจาก Mobile

Tweet [Big Data][Mobile Application] ถ้าจะพูดถีง (Big) Data ที่มีเพิ่มจำนวนมากขิ้นสุดในขณะนี้ ก็คงจะหนีไม่พ้นข้อมูลที่มาจาก mobile นะครับ มีบทความได้กล่าวถีงปรากฏการณ์ที่เรียกว่า immediate data และความต้องการ Insight ของ data ดังกล่าว แบบ real time, at the moment เพื่อนำมาตัดสินใจ และ นำเสนอ โฆษณา หรือ สื่อต่างๆกลับไปที่ mobile แล้วการที่จะทำ ระบบดังกล่าว หรือ Big Data Analytics สำหรับ Mobile Application มันมี ความท้าทายอย่างไรบ้าง Ben Kerschberg กล่าวไว้สามข้อ (แบบง่ายๆครับ) 1 ความท้าทายกับการรองรับ (Big) Data แบบปัจจุบันทีจะมีเพิ่มขิ้นเรื่อยๆ 2 ความท้าทายในการเก็บ ข้อมูล

sparkHadoop

Hadoop vs Spark

Tweet [Hadoop][Spark]   หลังจากที่มีผู้สนใจในเรื่องของ Apache Spark อย่างมากมาย จะมีคนพูดว่า จะนำ Spark มาใช้แทนที่ Hadoop เลยหรือไม่   มีบทความที่น่าสนใจ ที่ได้พูดถีงการเปรียบเทียบใน Hadoop ecosystem และ Spark framework ซิ่งมีสิ่งน่าน่าสนใจดังนี้   *Credit Rujirapong Ritwong from sharing original post   จากบทความ   1. อย่าไปหลงเชื่อกับ Vendors ที่ขาย “Big Data” และการขาย Hadoop Distribution โดยการนำ product หลายๆอย่างมารวมกัน   Product/Package ที่ vendors ได้นำเสนอแก่ลูกค้าไม่ใช่จะถูกต้องเสนอมไป คำว่า Hadoop จริงๆมันมี หลายๆส่วนประกอบ ซิ่ง

dsth_tableau_simplilearn

Tableau & Simplilearn จับมือ สร้าง Data Scientist 200,000 คนภายในห้าปี

Tweet Simplilean.com และ Tableau ได้จับมือกัน จัดตั้ง หลักสูตรออนไลน์ เพื่อ สร้าง Data Scientists 200,000 คน ภายในอีก 5 ปี ซิ่งเป็นการวางเป้าหมาย ที่ท้าทายมากๆ สำหรับ Tableau และ Simplilearn.com แต่น่าจะเป็นความท้าทายที่เป็นไปได้ เพราะ Simplilearn.comเป็น portal ที่ให้บริการ e-learning ที่เน้น สร้าง ผู้เชี่ยวชาญในด้านต่างๆอยู่แล้ว เช่น PMP, Certified in Microsoft, Hadoop หรือ Six Sigma. และ Tableau ก็เป็นเครื่องมือชั้นดี สำหรับ Data Scientist สำหรับ discover และ visualize (big) data เพื่อ นำ Data

ds_Team2

ทักษะต่างๆ Data Scientist แบ่งตาม 5 ระดับความเก่ง

Tweet [Data Science Skills][By Level]   แบ่งตาม Role ครับ (ผู้เริ่มสนใจ มือใหม่ เริ่มเก่ง เก่ง และ โคตรเก่งครับ) มีคนถามหลายคนว่า จะทำงาน Data Science ต้องมี skills อะไรบ้าง Data Science skills อะไรที่จำเป็น จำเป็นตอนไหน ในการประยุกต์ใช้ใน Big Data World จาก กราฟ แบ่งเป็น 6 ขั้นระดับ  (Data Science Roles) ไม่มีอะไรเลย (None) ผู้เริ่มต้น (Fundermental) มือใหม่ (Novice) เริ่มเก่ง (Intermediate) เก่ง (advanced) โคตรเก่ง (expert) จะเห็นได้ว่า Data Science มีหลายระดับ และ