Cơ sở dữ liệu và Truy vấn cho Khóa học dữ liệu

I. Tổng quan
  • Khóa học cung cấp cho học viên (HV) các kiến thức và kỹ năng cần thiết khi làm việc với cơ sở dữ liệu (database)
  • Trang bị cho HV những kiến thức nền tảng vững chắc về ngôn ngữ truy vấn (SQL): các loại truy vấn rút trích, thêm, xóa, cập nhật dữ liệu trong môi trường Data Science.
  • Hướng dẫn HV cách xây dựng và làm việc với CSDL trên Cloud (đám mây), truy cập CSDL với Python sử dụng DB-API
  • Hướng dẫn HV cách thu thập dữ liệu từ Twitter APIs sử dụng Tweepy Python Package
  • Cung cấp cho HV kiến thức phân tích dữ liệu với Python
II.  Thời lượng:  40 giờ.
III. Đối tượng học:
  • Sinh viên các trường Đại học, Cao đẳng
  • HV có định hướng sẽ làm việc trong lĩnh vực Data Science

IV. Mục tiêu khóa học

Sau khi hoàn thành khóa học, học viên sẽ đạt được các kỹ năng:

  • Áp dụng kiến thức về ngôn ngữ SQL trong việc sắp xếp và rút trích thông tin từ CSDL
  • Thực hiện các truy vấn có chọn lọc, nhóm, thống kê dữ liệu
  • Cập nhật dữ liệu trên bảng như thêm, xóa, cập nhật
  • Thu thập dữ liệu từ Twitter APIs sử dụng Tweepy Python Package
  • Làm việc với CSDL trên Cloud
  • Làm việc với cơ sở dữ liệu thực, công cụ khoa học dữ liệu thực và bộ dữ liệu trong thế giới thực
V. Nội dung khóa học

1. Database

  • Giới thiệu Database
  • Phân biệt DDL (Data Definition Language) và DML (Data Manipulation Language)
  • Tạo Database instance trên Cloud/máy tính

2. Basic SQL

  • CREATE/DROP TABLE
  • SELECT
  • COUNT/DISTINCT/LIMIT
  • INSERT
  • UPDATE
  • DELETE
  • CONSTRAINT
  • WHERE AND/OR/BETWEEN/IN

3. Advanced SQL

  • String Patterns (%), Ranges
  • ORDER BY
  • GROUP BY, HAVING
  • Built-in Function, Date, Timestamps
  • Sub-query, Nested-select
  • Multiple table: dùng sub-query, implicit JOIN, JOIN operators (INNER JOIN, OUTER JOIN)
  • Sử dụng operations để làm việc với multiple tables: INNER JOIN, LEFT OUTER JOIN, RIGHT OUTER JOIN, FULL OUTER JOIN
  • UNION

4. Truy cập Database với Python

  • Python và DB
    • Ưu điểm của Python khi làm việc với DB
    • Mô hình truy cập
    • SQL API
    • API của các SQL-Based DBMS system
  • Sử dụng DB API
    • Khái niệm DB-API
    • Khái niệm Python DB-API: Connection Ojbect, Cursor Object
    • Connection method
    • Cusor method
    • Khái niệm DB cursor
    • Sử dụng DB-API
  • Python code tạo table, tải dữ liệu và truy vấn dữ liệu
    • CREATE, INSERT, QUERY
    • Sử dụng pandas nhận dữ liệu từ tableipython-sql
    • Sử dụng Python Variables trong SQL Statements

5. Phân tích dữ liệu với Python

  • Tải csv file vào database warehouse trên cloud
  • Làm việc với SQLite/PostGre SQL

6. Twitter API

  • Truy cập Twitter API
  • Phân loại Twitter API
  • Tweets dạng JSON
  • Sử dụng Tweepy Python Package
  • Học trực tuyến

  • Học tại Hồ Chí Minh

  • Học tại Hà Nội


Các khóa học khác