Giám sát biến động sử dụng đất phục vụ hoạch định chính sách: Giải phóng tiềm năng của trí tuệ nhân tạo cho phát triển, đặt trọng tâm vào người dùng, Phần 1

This page in:

Lời ban biên tập: Đây là phần 1 của chuỗi blog thảo luận về ứng dụng điện toán đám mây và trí tuệ nhân tạo để khai thác thông tin từ ảnh viễn thám, đặt trọng tâm vào người dùng cuối, nhằm tăng cường quản lý hạ tầng, đất đai và các nguồn tài nguyên thiên nhiên. Các nền tảng công nghệ hỗ trợ ra quyết định trong quản trị công này ngày càng mang đến các giải pháp đơn giản hơn, giảm đáng kể độ phức tạp cho người dùng và chi phí.

Ngày nay, bất kỳ nơi nào trên trái đất đều được chụp lại bởi các vệ tinh viễn thám ít nhất một lần mỗi ngày. Nhờ các ảnh vệ tinh này, các nhà quản lý cấp địa phương nắm rõ hơn tình hình địa bàn và đưa ra các quyết định căn cứ vào diễn biến trên thực tế. Dù trong lĩnh vực nào quản lý hạ tầng, quy hoạch đô thị, quản trị môi trường hay phục hồi sau thảm họa thì ảnh vệ tinh ở góc nhìn bao quát cho thấy rõ hơn những xu hướng mà nếu đứng trên mặt đất khó có thể hình dung.

Hãy thử tìm một địa điểm bạn quan tâm trên Google Earth Timelapse  - Một ứng dụng web của Google hiển thị ảnh viễn thám theo chuỗi thời gian. Bạn sẽ theo dõi được sự thay đổi hàng năm từ năm 1986 đến 2018. Ứng dụng mở này sử dụng hàng ngàn ảnh vệ tinh Landsat từ kho dữ liệu của NASA để hiển thị trực quan sự biến động của bề mặt trái đất theo thời gian. Công nghệ trí tuệ nhân tạo (AI) có thể được sử dụng để tự động phân loại và chiết xuất thông tin từ các cơ sở dữ liệu ảnh lớn. Đây sẽ là một công cụ mạnh để phân tích dữ liệu và hiển thị trực quan phục vụ giám sát biến động sử dụng đất theo thời gian.

Ví dụ, hai ảnh phía dưới cho thấy tổng quan tình hình sử dụng đất tại Tp. Hồ Chí Minh năm 2018 và 1984. Cả hai ảnh đều cho thấy sân bay trong thành phố (hình elip màu xanh lá cây), nhưng đồng thời ta cũng có thể thấy diện tích xây dựng trong khu vực đã tăng đáng kể trong 30 năm qua. Hình cuối là ảnh phóng to sân bay sử dụng ảnh Landsat độ phân giải 30m cho thấy rõ hơn các công trình mọc lên quanh sân bay ở thời điểm năm 2018. Trên ảnh này ta có thể thấy các tuyến đường giao thông, các khối nhà cửa, khu cây xanh.

 

Ảnh Landsat trên Google Timelapse, TP. Hồ Chí Minh năm 1984 và năm 2018

Ho Chi Minh  City, Google EarthHo Chi Minh City in 1984

Ảnh Landsat trên Google Timelapse (30m/Pixel), sân bay Tân Sơn Nhất 2018
Ảnh Landsat trên Google Timelapse (30m/Pixel), sân bay Tân Sơn Nhất 2018

Google Earth

 

Tuy con người có thể phân biệt được các khối cây xanh, mặt nước, thậm chí các khối công trình xây dựng phức tạp, nhưng khó có thể xử lý và phân tích được một khối lượng lớn hình ảnh nếu không có sự hỗ trợ của các thuật toán. Các thuật toán AI sẽ giúp tự động hóa và tăng tính hiệu quả của quy trình này. Các công cụ hỗ trợ ra quyết định cho phép các bên liên quan truy cập kết quả phân tích ảnh bằng các thuật toán AI, giúp họ hiểu rõ hơn các thành phần của lớp phủ mặt đất và biết được ở đâu đã diễn ra biến động sử dụng đất trên địa bàn thành phố.

Chế biến AI

Phân loại ảnh vệ tinh vừa là vấn đề vừa mang tính khoa học vừa mang tính nghệ thuật. Đối với người dùng cuối thì đó là món ăn được chế biến từ 3 nguyên liệu chính: ảnh vệ tinh, nhãn “dữ liệu kiểm chứng thực địa” (tức là nhãn loại lớp phủ), và thuật toán AI. Câu hỏi ở đây là liệu kết quả có phù hợp với đúng mục đích sử dụng hay không? Liệu kết quả này có cung cấp được thông tin bổ ích, với mức độ chính xác và chi tiết có thể chấp nhận được với người dùng không? Các câu hỏi này cần được cân nhắc để điều chỉnh các thành phần cơ bản của món ăn.

Theo ngôn ngữ kỹ thuật, hướng tới người dùng có nghĩa là đưa ra một giải pháp cho một vấn đề hay một quy trình, phù hợp với nhu cầu của một nhóm người không nhất thiết phải có trình độ chuyên môn cao, thậm chí chỉ có kiến thức cơ bản về sử dụng máy tính. Use case – là các Trường hợp người dùng hay Mục đích sử dụng đưa ra những phân tích hoặc kết luận có thể ứng dụng công cụ trên thực tế hay không.

Ví dụ, trong một trường hợp người dùng cụ thể muốn sử dụng ảnh vệ tinh để phát hiện các tấm năng lượng mặt trời trên mái nhà thì sẽ cần ảnh có độ phân giải cao hơn, nhưng nếu chỉ cần biết sơ bộ về những khu vực có cây xanh thì chỉ cần ảnh độ phân giải thấp hơn là đủ. Cung cấp các công cụ này trực tiếp cho người dùng sẽ khuyến khích suy nghĩ sáng tạo trong các công việc có liên quan!

 

Ba thành phần chính để áp dụng AI gồm ảnh vệ tinh, dữ liệu nhãn kiểm chứng thực địa và thuật toán phân tích

Ba thành ph?n chính ?? áp d?ng AI g?m ?nh v? tinh, d? li?u nhãn ki?m ch?ng th?c ??a và thu?t toán phân tích

Các ảnh vệ tinh khác nhau về độ phân giải không gian (ví dụ, ảnh vệ tinh World View 3 có độ phân giải 30cm, tức là cao gấp 1.000 lần ảnh Landsat 8 - 30 m), độ phân giải phổ trong đó vệ tinh chụp lại các phổ ánh sáng khác nhau (ví dụ đỏ, xanh lục, xanh lam, hồng ngoại), và độ phân giải thời gian (ví dụ tần suất vệ tinh chụp ảnh cùng một địa điểm nhất định). Nhãn dữ liệu kiểm chứng thực địa thể hiện các số liệu điểm/pixel đã được con người phân loại chính xác bằng kinh nghiệm đoán đọc ảnh hay kiểm tra thực địa. Cuối cùng, các thuật toán AI khác nhau cần được huấn luyện để thực hiện việc phân loại ảnh như mong muốn.

Việc hiện nay nhiều luận án tiến sĩ tìm hiểu mô hình nào được thiết kế phù hợp nhất cho từng vấn đề thể hiện rằng hầu hết chúng ta có xu hướng tìm kiếm các giải pháp đóng gói sẵn.

Trong phần blog số 2 chúng tôi sẽ trình bày về công nghệ và số liệu vệ tinh và các ứng dụng của chúng trong cuộc sống.

Ảnh dưới đây là dữ liệu phân loại lớp phủ bề mặt được NASA cung cấp trực tuyến từ nguồn ảnh MODIS độ phân giải trung bình (Moderate Resolution Imaging Spectroradiometer, MODIS) , mỗi pixel ảnh thể hiện một khu vực có kích thước 500m. Ảnh không chỉ thể hiện khu vực Tp. Hồ Chí Minh theo ranh giới năm 2011 mà bao gồm cả vùng đồng bằng sông Cửu long. Các công cụ hướng tới người sử dụng tương tự có thể giúp mọi người chiết xuất thông tin một cách chi tiết, nhanh chóng và kịp thời trên giao diện web.

Ho Chi Minh City

 


Authors

Kai Kaiser

Senior Economist, World Bank

Caleb Robinson

Ph.D. student in the School of Computational Science and Engineering at Georgia Institute of Technology

Bistra Dilkina

Associate Director for the Center on AI in Society at the University of Southern California and an Assistant Professor of Computer Science

Dan Morris

Principal Scientist at Microsoft

Nebojsa Jojic

Senior Principal Researcher at Microsoft Research

Huong Thi Lan Tran

Senior Public Sector Specialist - World Bank Vietnam country office

Join the Conversation

The content of this field is kept private and will not be shown publicly
Remaining characters: 1000