ถ้าศึกษาหรือทดลองทำงานด้าน Quant หนีไม่พ้นเรื่องของ Data แน่นอนว่าถ้าหาฟรีไม่ได้ก็มีต้องซื้อจาก Data Provider ซึ่งก็จะมีต้นทุน กรณีที่เริ่มต้นมีบางแหล่งที่แจกจ่ายข้อมูลฟรีให้ได้ทดลองนำไปใช้อยู่
วันนี้มาแนะนำแหล่งข้อมูลฟรีจาก FXCM ซึ่งเป็นโบรกเกอร์ที่รองรับ Quant Trading System ล่าสุดเปิดช่องทางแจกจ่ายข้อมูลราคาในตลาดค่าเงิน(FX) จำนวน 21 คู่เงิน ระดับ Tick Data (Raw Data ละเอียดสุดยังไม่จัดกลุ่มตาม timeframe) โดยเป็นข้อมูลย้อนหลังตั้งแต่ปี 2015 ถึงปัจจุบันและจะมีการ Update ข้อมูลใหม่ๆทุกๆสัปดาห์
การ Download ทำได้ผ่าน API แบบเป็น gz file ก็ได้หรือจะใช้ Python เขียนโปรแกรมสำหรับการ Download อัตโนมัติก็ได้เช่นกัน โดยเราสามารถเลือกรูปแบบ output file ที่ต้องการได้ ซึ่งผมมีโอกาสทดลองทั้งสอบแบบแล้ว พบว่าใช้งานได้ดีมาก
ไฟล์ tick data ของค่าเงิน USDJPY ระยะ 1 ปีที่ดาวน์โหลดได้ เมื่อแตกไฟล์แล้วขนาดราวๆ 150 MB มี Feature ได้แก่ DateTime,Bid,Ask จำนวนราวๆ 1.8 ล้านบรรทัด หน้าตาเหมือนกับภาพด้านล่าง ตรงนี้เป็น csv สามารถนำเข้า database นำไปใช้ในการทำ data analysis ต่อได้เลย(ไม่ต้อง clean ข้อมูลเพิ่ม) พวกนี้เหมาะกับการวิเคราะห์ market activity หรือทำโมเดลการวิเคราะห์พฤติกรรมราคา วิเคราะห์ความถี่ วิเคราะห์ Price Clustering หรือทำ market profile อย่างละเอียดต่อไป ส่วนใครอยากได้ OHCL ก็ทำการจัดกลุ่มแล้ว build จาก raw data ได้
ปล. ถ้าโหลดมาทั้งปีข้อมูลมันใหญ่อย่าไปเปิดกับ excel หรือใช้โปรแกรมที่ไม่รอบรับฐานข้อมูลขนาดใหญ่ระดับ million records นะครับ
เข้าไปอ่านรายละเอียดเพิ่มเติมได้จาก link ด้านล่าง
https://www.fxcm.com/uk/trading-services/free-tick-data/
https://www.fxcm.com/uk/trading-services/free-tick-data/