วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

Journal Week9

Data Warehouses มีจุดประสงค์เพื่อสร้างเป็นที่เก็บข้อมูลสำหรับการดำเนินงานโดยสามารถเข้าถึงข้อมูลได้รวดเร็ว
ข้อดี : สามารถเข้าถึงข้อมูลได้รวดเร็วเพราะข้อมูลอยู่ในที่เดียวกัน และผู้ใช้สามารถเข้าถึงข้อมูลได้ง่าย และบ่อยครั้งเท่าที่ต้องการโดยใช้เว็บเบราเซอร์
ลักษณะของ Data Warehouses
1.      Organization ข้อมูลถูกคัดเลือก และนำมาใส่ใน data warehousesโดยจัดเรียงตามรายละเอียด หัวข้อ
2.      Consistency ข้อมูลอาจถูกบันทึกใน database ต่างกัน แต่เมื่อมาอยู่ในwarehouseจะต้องทำให้อยู่ในรูปแบบเดียวกัน
3.      Time variant ข้อมูลอาจเก็บไว้5-10ปี ตามแต่ลักษณะ,กระแส,การคาดคะเน
4.      Non-volatile ข้อมูลจะไม่มีการเปลี่ยนแปลงเพราะเป็นการเก็บข้อมูลย้อนหลัง อาจมีแค่เติมข้อมูลใหม่ลงไปเท่านั้น
5.      Relational
6.      Client/server ใช้client/serverในการให้บริการ เพื่อให้ผู้ใช้เข้าถึงได้ง่าย
Data Warehouse Processing
1.      รวบรวมข้อมูล จากภายในและภายนอกองค์กร
2.      สร้าง Meta Data โดยใช้ข้อมูลที่รวบรวมมา ซึ่งเป็นข้อมูลที่ใช้อธิบายเกี่ยวกับข้อมูลในwarehouse
3.      Data Staging เป็นการจัดการข้อมูลเพื่อใส่ใน data warehouse ประกอบด้วย Extract, Clean, Transform, Load เพื่อสร้างเป็นdatacube
4.      สร้างData Warehouse นำข้อมูลdata cube มาทำเป็น data warehouse โดยยึดวัตถุประสงค์ของธุรกิจเป็นหลัก
5.      สร้าง business view นำเสนอข้อมูลสำหรับผู้บริหาร เพื่อให้ผู้บริหารนำไปใช้
Data Mart เป็นการนำข้อมูลบางส่วนของ data warehouse มาใช้สำหรับ strategic business unit หรือแต่ละแผนก แบ่งเป็น
- Replicated(dependent)เป็นการคัดลอกบางส่วนของdata warehouseมา
- Stand-alone เช่น datamart ของแต่ละแผนกโดยไม่มีdata warehouse
Data Cube เป็นฐานข้อมูลหลายมิติ(Multidimensional databases aka. OLAP) ที่จัดการข้อมูลตามมิติ เช่น ภูมิศาสตร์ เวลา ผลิตภัณฑ์
Business Intelligence (BI)
เป็นกระบวนการที่รวมเอาเครื่องมือ ฐานข้อมูล วิธีการต่างๆมาเพื่อใช้ในการเข้าถึง จัดการข้อมูล และให้สามารถนำข้อมูลไปวิเคราะห์ทางธุรกิจได้ โดยแบ่งเป็น
Reporting and analysis 
  • Enterprise reporting and analysis
  • Enterprise search
  • Scorecards
  • Dashboards
  • Visualization tool
Analytics
  • Predictive analytics
  • Data,text and web mining
  • OLAP(online analytics processing
Data Integration
  • ETL (extract,transformation,load)
  • EII (enterprise information integration)

Data Mining ช่วยในการวิเคราะห์ข้อมูลจำนวนมากใน Database เพื่อช่วยในการตัดสินใจ ทำให้สามารถเห็นpatternของข้อมูลได้

Text Mining เป็น Data mining สำหรับข้อมูลที่ไม่มีโครงสร้างในการจัดเก็บ เช่น การประกันสินค้า การให้ความช่วยเหลือลูกค้า

วันพฤหัสบดีที่ 13 มกราคม พ.ศ. 2554

Journal week8

  ระบบ (System) มีองค์ประกอบ คือ 
1-Input ข้อมูลดิบที่เราใส่เข้าไป
2-Process กระบวนการแปลงข้อมูลดิบเพื่อให้นำไปใช้ได้
3-Output ข้อมูลที่ผ่านกระบวนการแล้ว ซึ่งเป็นสิ่งที่เราต้องการจากระบบ
                วัตถุประสงค์จะเป็นตัวกำหนดว่า Outputที่เราต้องการเป็นแบบไหน จากนั้นไปดูว่าต้องใช้วิธีการอะไรถึงจะได้มา สุดท้ายแล้วจึงรู้ว่าต้องใช้ Input แบบไหนเพื่อให้ได้ผลลัพธ์ที่ต้องการ แต่ข้อมูลที่ออกมาจะกระจัดกระจาย ไม่เป็นระเบียบ เพราะฉะนั้นจึงต้องมีกลไกทำให้เป็นระเบียบ
            ระบบสารสนเทศ (Information System)
เป็นระบบที่ทำหน้าที่รวบรวมข้อมูลเพื่อนำมาประมวลผล วิเคราะห์เพื่อสร้างสารสนเทศสำหรับวัตถุประสงค์เฉพาะด้าน และนำเสนอให้ผู้ที่ต้องการซึ่งต้องเป็นผู้มีสิทธิได้รับสารสนเทศ นอกจากนี้ยังมีการจัดเก็บและบันทึกข้อมูลเพื่อใช้ในอนาคตด้วย แบ่งได้เป็น 3 ประเภท คือ  Transaction processing system, Decision support system, Executive support system
องค์ประกอบของ IS 
1.       Hardware
2.       Software
3.       Data
4.       Network
5.       Procedures
6.       People
ต้องมีครบ6องค์ประกอบ แต่ไม่จำเป็นว่าถ้ามี6อย่างนี้แล้วจะต้องเป็น IS

Data Management มีจุดประสงค์เพื่อสร้างinfrastructure เพื่อเปลี่ยนข้อมูลดิบไปเป็นข้อมูลที่มีคุณภาพสูงแก่องค์กร

Data Life Cycle Process
New DataàDatabase/Data warehouse/Data MartsàAccess warehouse &Take a copyàAnalysis

Data Warehouses
ข้อดี : เข้าถึงข้อมูลได้เร็ว ง่าย end-user เข้าถึงข้อมูลได้เอง
เหมาะกับองค์กร : มีข้อมูลเยอะและ end-user ต้องเข้าถึงได้, ข้อมูลที่ใช้ดำเนินงานถูกเก็บอยู่ในระบบต่างกัน, ฐานข้อมูลลูกค้ามีขนาดใหญ่และเปลี่ยนบ่อย