Khai thác dữ liệu Twitter

Giới thiệu

Chúng ta luôn cố gắng dự đoán tương lai. Liệu trời có mưa trong chuyến picnic sắp đến của chúng ta? Thị trường
chứng khoán hay các cổ phiếu riêng rẽ tăng hay giảm, và khi nào và bao nhiêu? Người dân bỏ phiếu như thế nào
trong cuộc bầu cử tiếp theo? Cơ hội gì một oil exploration venture sẽ strike oil và nó khả năng sinh ra bao
nhiêu? Một đội baseball có sẽ thắng nhiều games hơn nếu nó thay đổi triết lí batting sang “swing for the fences?”
Lưu lượng khách hàng does an airline anticipate bao nhiêu trong nhiều tháng tiếp theo? Công ty mua oil commodity
futures như thế nào để đảm bảo rằng nó sẽ có nguồn cung nó cần và hi vọng là tại một chi phí tối thiểu? Đường đi
một hurricane có khả năng đi và độ mạnh nó trở nên (loại 1,2,3,4 hay 5)?. Loại thông tin đó là then chốt đối với
các nỗ lực chuẩn bị khẩn cấp. Liệu một giao dịch tài chính có khả năng là gian lận? Một mortgage là mặc định? Liệu
một disease có khả năng lan truyền nhanh và nếu như vậy tại vùng địa lí nào?
Dự đoán là một thách thức và thường là một quá trình phí tổn, nhưng phần thưởng tiềm năng là lớn. Với công nghệ
chúng ta sẽ nghiên cứu trong học phần này và tiếp theo, chúng ta sẽ thấy AI thường hoạt động với dữ liệu lớn, nhanh
chóng cải thiện như thế nào khả năng dự đoán.
Trong học phần này chúng ta tập trung vào khai thác dữ liệu Twitter, tìm kiếm cho mức tình cảm trong các tweets.
Khai thác dữ liệu là quá trình tìm kiếm qua các bộ dữ liệu lớn, thường là big data, để tìm ra cái nhìn bên trong
cái có thể là có giá trị đối với các cá nhân và tổ chức. Mức tình cảm cái bạn khai thác dữ liệu từ các tweets có
thể giúp dự đoán kết quả của cuộc bầu cử, doanh số của một movie mới có khả năng tạo ra và thành công của chiến
dịch marketing của một công ty. Nó cũng giúp các công ty định vị điểm yếu trong cung cấp sản phẩm của đối thủ cạnh
tranh.

Chia sẻ