Luận án Chẩn đoán kết cấu cầu dựa trên chuỗi dữ liệu đo dao động theo thời gian kết hợp sử dụng mạng học sâu tích chập

MỤC LỤC

DANH MỤC HÌNH VẼ . v

DANH MỤC BẢNG BIỂU . viii

DANH MỤC CHỮ VIẾT TẮT . ix

MỞ ĐẦU . 1

1. Mở đầu . 1

2. Mục tiêu nghiên cứu . 7

3. Phương pháp nghiên cứu . 7

4. Đối tượng và phạm vi nghiên cứu . 8

5. Ý nghĩa khoa học và thực tiễn . 8

6. Nội dung và kết cấu của luận án . 8

CHƯƠNG 1 : TỔNG QUAN VỀ NGHIÊN CỨU CHẨN ĐOÁN SỨC KHỎE

KẾT CẤU CÔNG TRÌNH CẦU DỰA TRÊN PHƯƠNG PHÁP ĐO NHẬN

DẠNG DAO ĐỘNG . 11

1.1 Tổng quan về nghiên cứu chẩn đoán sức khỏe kết cấu công trình cầu dựa trên

phương pháp đo nhận dạng dao động . 11

1.1.1 Giới thiệu về chẩn đoán sức khỏe kết cấu công trình cầu dựa trên phương

pháp đo nhận dạng dao động . 11

1.1.2 Mục đích của chẩn đoán sức khỏe kết cấu dựa trên phương pháp đo

nhận dạng dao động . 13

1.1.3 Sự phát triển của các phương pháp chẩn đoán sức khỏe kết cấu dựa trên

phương pháp đo nhận dạng dao động . 16

1.2 Các nghiên cứu trên thế giới về chẩn đoán kết cấu dựa trên phương pháp đo

nhận dạng dao động . 21

1.3 Các nghiên cứu ở Việt Nam về chẩn đoán kết cấu dựa trên phương pháp đo

nhận dạng dao động. . 27

1.4 Kết luận Chương 1 . 30

- iii -

CHƯƠNG 2 CƠ SỞ LÝ THUYẾT VỀ GIÁM SÁT SỨC KHỎE KẾT CẤU

SỬ DỤNG DỮ LIỆU CHUỖI THỜI GIAN DỰA TRÊN CÁC ĐẶC TRƯNG

ĐỘNG HỌC . 32

2.1 Khái niệm về dữ liệu chuỗi thời gian (Time series data) . 32

2.2 Dữ liệu chuỗi thời gian cho giám sát sức khỏe kết cấu . 34

2.3 Các loại dữ liệu chuỗi thời gian . 37

2.4 Tính bất định của dữ liệu chuỗi thời gian trong giám sát sức khỏe kết cấu cầu

 . 39

2.4.1 Phương trình dao động của kết cấu [131] . 39

2.4.2 Dao động tự do [131] . 41

2.4.3 Dao động tắt dần [131] . 45

2.4.4 Đặc trưng bất định, ngẫu nhiên của chuỗi dữ liệu theo thời gian trong

giám sát sức khỏe kết cấu cầu . 47

2.5 Phương pháp xấp xỉ tổng hợp tượng trưng (Symbolic Aggregate

approXimation – SAX). . 51

2.6 Phương pháp phân rã sóng rời rạc đa cấp (Multilevel Discrete Wavelet

Decomposition – MDWD) . 54

2.7 Kết luận Chương 2 . 56

CHƯƠNG 3 MẠNG HỌC SÂU TRUYỀN THỐNG VÀ MẠNG HỌC SÂU

TÍCH CHẬP ỨNG DỤNG TRONG CHẨN ĐOÁN KẾT CẤU CÔNG

TRÌNH CẦU . 57

3.1 Mạng học sâu truyền thống . 57

3.1.1 Cấu trúc cơ bản của mạng học sâu truyền thống . 59

3.1.2 Một số mạng học sâu truyền thống . 63

3.1.3 Mạng học sâu CNN 2 chiều (2DCNN) . 63

3.1.4 Mạng học sâu CNN một chiều . 64

3.2 Mạng học sâu tích chập đề xuất . 66

3.3 Kết luận chương 3. . 73

- iv -

CHƯƠNG 4 ÁP DỤNG MẠNG HỌC SÂU TÍCH CHẬP KẾT HỢP

PHƯƠNG PHÁP SAX-MDWD ĐỂ CHẨN ĐOÁN CÁC HƯ HỎNG CHO

MÔ HÌNH CẦU . 74

4.1 Áp dụng mạng học sâu tích chập kết hợp phương pháp SAX-MDWD để chẩn

đoán các hư hỏng cho mô hình cầu thực tế . 74

4.1.1 Giới thiệu mô hình cầu . 74

4.1.2 Xử lý dữ liệu . 79

4.1.3 Kiến trúc mạng . 82

4.1.4 Huấn luyện mạng và phân tích kết quả . 84

4.2 Áp dụng mạng học sâu tích chập để chẩn đoán các hư hỏng cho mô hình cầu

trong phòng thí nghiệm . 93

4.2.1 Mô tả mô hình . 93

4.2.2 Thí nghiệm đo dao động mô hình cầu dây văng . 95

4.2.3 Phân tích xử lý số liệu . 99

4.2.4 Xử lý dữ liệu . 103

4.2.5 Các trường hợp tạo hư hỏng . 104

4.2.6 Kiến trúc mạng . 105

4.2.7 Phân tích kết quả . 107

4.3 Kết luận chương 4. . 111

KẾT LUẬN VÀ KIẾN NGHỊ . 112

TÀI LIỆU THAM KHẢO . PL1

DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN . PL14

Phụ lục: Code . PL15

pdf144 trang | Chia sẻ: vietdoc2 | Ngày: 28/11/2023 | Lượt xem: 148 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Luận án Chẩn đoán kết cấu cầu dựa trên chuỗi dữ liệu đo dao động theo thời gian kết hợp sử dụng mạng học sâu tích chập, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
�3 ⋮ 𝜔𝑁} (2.14) Có thể chỉ ra rằng đối với các ma trận khối lượng và độ cứng xác định dương, đối xứng, thực gắn liền với các hệ kết cấu ổn định, tất cả các nghiệm của phương trình tần số sẽ là số thực và dương. 2.4.2.2 Phân tích hình thái dao động Khi tần số dao động được xác định từ phương trình (2.13) các phương trình chuyển động (2.11) có thể được biểu diễn dưới dạng �̃�(𝑛)�̂�𝑛 = 𝟎 (2.15) trong đó �̃�(𝑛) = 𝐤 − 𝜔𝑛 2𝐦 (2.16) Do đó �̃�(𝑛) biểu thị ma trận thu được bằng ma trận độ cứng trừ đi 𝜔𝑛 2𝐦; vì nó phụ thuộc vào tần số nên nó khác nhau ở mỗi hình thái. Phương trình (2.15) được thỏa mãn giống nhau vì tần số được đánh giá từ điều kiện này; do đó biên độ của dao động là không xác định. Tuy nhiên, hình dạng của hệ dao động có thể được xác định bằng cách giải tất cả các chuyển vị theo một tọa độ bất kỳ. - 44 - Với mục đích này , giả sử rằng phần tử đầu tiên của vectơ chuyển vị có biên độ đơn vị ta có: { �ˆ�1𝑛 �ˆ�2𝑛 �ˆ�3𝑛 ⋮ �ˆ�𝑁𝑛} = { 1 �ˆ�2𝑛 �ˆ�3𝑛 ⋮ �ˆ�𝑁𝑛} (2.17) Ở dạng mở rộng, phương trình (2.15) khi đó có thể được viết [ 𝑒11 (𝑛) 𝑒12 (𝑛) 𝑒13 (𝑛) ⋯ 𝑒1𝑁 (𝑛) 𝑒21 (𝑛) 𝑒22 (𝑛) 𝑒23 (𝑛) ⋯ 𝑒2𝑁 (𝑛) 𝑒31 (𝑛) 𝑒32 (𝑛) 𝑒33 (𝑛) ⋯ 𝑒3𝑁 (𝑛) 𝑒𝑁1 (𝑛) 𝑒𝑁2 (𝑛) 𝑒𝑁3 (𝑛) ⋯ 𝑒𝑁𝑁 (𝑛) ] { 1 �ˆ�2𝑛 �ˆ�3𝑛 ⋯ �ˆ�𝑁𝑛} = { 0 0 0 ⋯ 0} (2.18) trong đó phân vùng được chỉ định tương ứng với biên độ chuyển vị chưa được biết. Để thuận tiện, phương trình (2.18) sẽ được biểu diễn lại như sau: [ 𝑒11 (𝑛) �̃�10 (𝑛) �̃�01 (𝑛) �̃�00 (𝑛) ] { 1 �ˆ�0𝑛 } = { 0 𝟎 } (2.19) từ đó �̃�01 (𝑛) + �̃�00 (𝑛) �ˆ�0𝑛 = 𝟎 (2.20) cũng như 𝑒11 (𝑛) + �̃�10 (𝑛) �ˆ�0𝑛 = 0 (2.21) Phương trình (2.20) có thể được giải đồng thời cho biên độ chuyển vị �ˆ�0𝑛 = −(�̃�00 (𝑛) ) −1 �̃�01 (𝑛) (2.22) Thực tế thì phương trình (2.21) và phương trình (2.22) khi giải sẽ cho ra cùng một kết quả hay là vecctơ chuyển vị thu được trong phương trình (2.22) phải - 45 - thỏa mãn phương trình (2.21), điều kiện này giúp kiểm tra về tính chính xác của lời giải. Cần lưu ý rằng không phải lúc nào cũng có thể để chuyển vị của phần tử đầu tiên là chuyển vị là đơn vị; độ chính xác sẽ được cải thiện nếu phần tử đơn vị được gán cho một trong các vị trí chuyển vị lớn hơn. Trình tự giải có thể được sử dụng một cách tương tự trong mọi trường hợp chỉ bằng cách sắp xếp lại thứ tự các hàng và cột một cách �̃�(𝑛)thích hợp. Chuyển vị thu được từ phương trình (2.22) cùng với chuyển vị đơn vị của thành phần thứ nhất tạo thành vectơ chuyển vị liên quan đến phương thức dao động thứ 𝑛. Để thuận tiện, vectơ thường được biểu diễn ở dạng không thứ nguyên bằng cách chia tất cả các thành phần cho một thành phần tham chiếu (thường là lớn nhất). Vectơ kết quả được gọi là 𝜙𝑛 của hình thái dao động thứ 𝑛; do đó 𝝓𝑛 = { 𝜙1𝑛 𝜙2𝑛 𝜙3𝑛 ⋮ 𝜙𝑁𝑛} ≡ 1 �ˆ�𝑘𝑛 { 1 �ˆ�2𝑛 �ˆ�3𝑛 ⋮ �ˆ�𝑁𝑛} (2.23) trong đó �ˆ�𝑘𝑛 là thành phần tham chiếu, được lấy làm thành phần đầu tiên ở đây. Hình dạng của từng 𝑁 dạng dao động có thể được tính toán bằng cùng một quá trình tính này; ma trận vuông gồm 𝑁 các hình thái dao động sẽ được biểu diễn bằng 𝚽 như sau: 𝚽 = [𝜙1 𝜙2 𝜙3 ⋯ 𝜙𝑁] = [ 𝜙11 𝜙12 ⋯ 𝜙1𝑁 𝜙21 𝜙22 ⋯ 𝜙2𝑁 𝜙31 𝜙32 ⋯ 𝜙3𝑁 𝜙41 𝜙42 ⋯ 𝜙4𝑁 ⋯ ⋯ ⋯ ⋯ 𝜙𝑁1 𝜙𝑁2 ⋯ 𝜙𝑁𝑁] (2.24) 2.4.3 Dao động tắt dần [131] Các điều kiện trong đó phép biến đổi tọa độ chuẩn cũng sẽ dùng để tách các phương trình suy giảm của chuyển động. Các phương trình tọa độ chuẩn của - 46 - (2.7) và đạo hàm theo thời gian của nó và nhân với chuyển vị của vectơ hình thái dao động thứ 𝑛 (𝝓𝑛 𝑇) dẫn tới: 𝝓𝑛 𝑇𝒎𝜱�̈�(𝑡) + 𝝓𝑛 𝑇𝒄𝜱�̇�(𝑡) + 𝝓𝑛 𝑇𝒌𝜱𝒀(𝑡) = 𝝓𝑛 𝑇𝒑(𝑡) (2.25) Trong phương trình này, ma trận hình thái dao động 𝜱 (N × N) dùng để biến đổi vectơ tọa độ tổng quát 𝑌 thành vectơ tọa độ hình học 𝑥. Các thành phần tổng quát trong vectơ 𝑌 được gọi là tọa độ chuẩn của kết cấu. Đạo hàm bậc 2 của chuyển vị �̈� = 𝚽�̈� (lưu ý rằng hình dạng phương thức không thay đổi theo thời gian). Lưu ý rằng các điều kiện trực giao: 𝝓𝑚 𝑇 𝐦𝝓𝑛 = 0 𝝓𝑚 𝑇 𝐤𝝓𝑛 = 0 𝑚 ≠ 𝑛 Gây ra tất cả các thành phần ngoại trừ số hình thái dao động thứ n trong biểu thức khối lượng và độ cứng của biểu thức (2.25) biến mất. Việc giảm tương tự sẽ áp dụng cho biểu thức tắt dần nếu giả sử rằng điều kiện trực giao tương ứng áp dụng cho ma trận tắt dần; nghĩa là, giả sử rằng: 𝝓𝑚 𝑇 𝑐𝝓𝑛 = 0; 𝑚 ≠ 𝑛 (2.26) Trong trường hợp này phương trình (2.25) có thể được viết: 𝑀𝑛�̈�𝑛(𝑡) + 𝐶𝑛�̇�𝑛(𝑡) + 𝐾𝑛𝑌𝑛(𝑡) = 𝑃𝑛(𝑡) (2.27) Trong đó các định nghĩa về khối lượng tọa độ phương thức, độ cứng và tải trọng và hệ số giảm chấn nhớt tọa độ phương thức được xác định : 𝑀𝑛 = 𝝓𝑛 𝑇𝑚𝝓𝑛 (a) 𝐾𝑛 = 𝝓𝑛 𝑇𝑘𝝓𝑛 (b) 𝑃𝑛(𝑡) = 𝝓𝑛 𝑇𝑝(𝑡) (c) 𝐾𝑛 = 𝜔𝑛 2𝑀𝑛 (d) 𝐶𝑛 = 𝝓𝑛 𝑇𝑐𝝓𝑛 (e) (2.28) - 47 - Nếu phương trình (2.27) được chia cho khối lượng tổng quát, phương trình chuyển động dạng thức này có thể được biểu diễn dưới dạng thay thế: �̈�𝑛(𝑡) + 2𝜉𝑛𝜔𝑛�̇�𝑛(𝑡) + 𝜔𝑛 2𝑌𝑛(𝑡) = 𝑃𝑛(𝑡) 𝑀𝑛 (2.29) Trong đó phương trình (2.28) đã được sử dụng để viết lại số hạng độ cứng và số hạng thứ hai ở phía bên trái thể hiện định nghĩa về tỷ số giảm chấn nhớt phương thức: 𝜉𝑛 = 𝐶𝑛 2𝜔𝑛𝑀𝑛 (2.30) Như đã phân tích trước đó, bằng cách sử dụng tỷ số cản cho từng hình thái dao động theo cách này hơn là đánh giá các hệ số của ma trận tắt dần 𝐶 sẽ thuận tiện và hợp lý hơn về mặt vật lý khi xác định hệ số tắt dần của hệ thống MDOF, vì tỷ số tắt dần theo phương thức 𝜉𝑛 có thể là được xác định bằng thực nghiệm hoặc ước tính với độ chính xác phù hợp trong nhiều trường hợp. 2.4.4 Đặc trưng bất định, ngẫu nhiên của chuỗi dữ liệu theo thời gian trong giám sát sức khỏe kết cấu cầu Chuỗi dữ liệu theo thời gian trong giám sát sức khỏe kết cấu cầu có một số đặc trưng cơ bản sau: Tính tương quan thời gian: Chuỗi dữ liệu theo thời gian được trích xuất từ đặc trưng động có tính tương quan thời gian cao. Điều này có nghĩa là các giá trị trong chuỗi dữ liệu thường có mối quan hệ với nhau theo thời gian, và những thay đổi xảy ra tại một thời điểm có thể ảnh hưởng đến những thay đổi xảy ra tại các thời điểm khác. Động lực học: Chuỗi dữ liệu theo thời gian trong quan trắc cầu có tính động lực học, tức là các giá trị trong chuỗi thường biến đổi theo thời gian, và thay đổi này có thể do nhiều nguyên nhân như tải trọng xe cộ, thời tiết, độ ẩm, nhiệt độ,... - 48 - Tính chất chu kỳ: Chuỗi dữ liệu theo thời gian của quan trắc cầu thường có tính chất chu kỳ, có nghĩa là các giá trị trong chuỗi có xu hướng lặp lại theo chu kỳ thời gian nhất định. Tính nhiễu: Chuỗi dữ liệu theo thời gian của quan trắc cầu có thể chứa các điểm nhiễu do các yếu tố bên ngoài ảnh hưởng, chẳng hạn như sai số trong quá trình đo lường hoặc do sự cố kỹ thuật. Tính dễ bị ảnh hưởng bởi môi trường: Dữ liệu dao động thường dễ bị ảnh hưởng bởi các yếu tố môi trường như thời tiết, tải trọng, động đất, gió, ... Trong giám sát sức khỏe kết cấu cầu, độ chính xác của bài toán giám sát sức khỏe thường phụ thuộc rất lớn vào chất lượng dữ liệu. Tuy nhiên, việc thu thập dữ liệu cho bài toán này thường gặp phải nhiều thách thức, bao gồm các vấn đề trong công tác đo đạc gây ra tính bất định của kết quả đo cũng như vấn đề xử lý đối với dữ liệu lớn. Theo ISO/IEC GUIDE 99 “Tính bất định là một khái niệm liên quan đến kết quả của một phép đo lường, bao gồm cả sự biến động và sự không chắc chắn về giá trị của kết quả. Nó được biểu thị bằng một khoảng ước tính giá trị, trong đó giá trị của kết quả được xác định là một giá trị trung bình của một số đo lường, và khoảng giá trị này cho phép xác định mức độ không chắc chắn của kết quả”. Thực tế, không có phép đo nào là chính xác, khi một đại lượng được đo, kết quả phụ thuộc vào nhiều yếu tố như hệ thống thiết bị đo, trình tự thủ tục đo, kỹ năng của người thao tác, môi trường và các ảnh hưởng khác. Ngay cả khi đại lượng đó được đo nhiều lần, theo cùng một cách thức và trong cùng hoàn cảnh thì mỗi lần vẫn thường thu được giá trị đại lượng đo được khác nhau, với giả định rằng hệ thống đo có đủ độ phân giải để phân biệt giữa các giá trị chỉ thị. Có hai loại đại lượng sai số đo, hệ thống và ngẫu nhiên. Sai số hệ thống (độ chệch đo) là giá trị đại lượng đo được có sự dịch chuyển. Sai số ngẫu nhiên là khi phép đo được lặp lại thì nó thường cho giá trị đại lượng đo được khác với giá trị - 49 - trước đó. Trong công tác đo đạc kết cấu công trình cầu, nói chung, có thể có một số thành phần đóng góp vào tính bất định của kết quả đo dao động, gồm: - Độ không đảm bảo đo trong hiệu chuẩn: Thực tế, từng thiết bị đo có thể tạo ra các độ không đảm bảo đo khác nhau. Mục đích chính của việc hiệu chuẩn thiết bị đo là để giảm độ không đảm bảo đo đến mức có thể chấp nhận được. Quá trình hiệu chuẩn hoàn thành mục tiêu đó bằng cách thay độ không đảm bảo đo lớn của thiết bị chưa được hiệu chuẩn bằng sự kết hợp nhỏ hơn giữa độ không đảm bảo đo của thiết bị điều khiển chuẩn và sự so sánh giữa nó và thiết bị đo. Như vậy, xét về mặt kỹ thuật, bản chất của việc hiệu chuẩn chính là việc so sánh phương tiện đo với chuẩn để đánh giá sai số và các đặc trưng kỹ thuật, đo lường khác của nó. Hiệu chuẩn chính là biện pháp để truyền độ lớn của đơn vị đo lường từ chuẩn có độ chính xác cao nhất tới các phương tiện đo thông thường nhằm đảm bảo tính thống nhất và độ chính xác cần thiết của tất cả phương tiện đo. - Độ không đảm bảo đo thu thập dữ liệu: Độ không đảm bảo đo trong hệ thống thu thập dữ liệu có thể sinh ra từ bộ biến đổi tín hiệu, từ các cảm biến hay thiết bị thu khác, v.v, Phương pháp tốt nhất để giảm thiểu những tác động của nhiều nguồn độ không đảm bảo đo này là thực hiện hiệu chuẩn toàn hệ thống. Bằng việc so sánh giá trị đầu vào đã biết với kết quả được đo của chúng, có thể nhận được ước lượng độ không đảm bảo đo thu thập dữ liệu. Tuy vậy, không thể luôn luôn làm điều này. Trong những trường hợp này cần phải đánh giá mỗi thành phần của độ không đảm bảo đo và tổng hợp chúng lại để dự đoán trước độ không đảm bảo đo tổng thể. - Độ không đảm bảo đo xử lý dữ liệu: Các nguồn độ không đảm bảo đo điển hình trong loại này xuất phát từ sự làm khớp đường cong và độ phân giải tính toán. Sự làm khớp đường cong có thể được dùng để thừa nhận sự không tuyến tính. Tuy nhiên, khi công thức được hình thành từ việc phân tích hồi quy dữ liệu hiệu chuẩn biểu thị điểm thích hợp nhất của dữ liệu đó, sự phân bố của đường cong chỉ ra rằng với nhiều dữ liệu, công thức ít khác nhau sẽ cho phương pháp giống nhau như giá trị trung bình của một dãy dữ liệu sẽ thay đổi khi nhiều giá trị - 50 - đạt được. Như vậy, mỗi hệ số trong công thức hồi quy sẽ có một độ không đảm bảo đo liên kết với nó. - Độ không đảm bảo đo do các tác động ngoại cảnh Độ không đảm bảo đo do phương pháp được xác định là các nguồn độ không đảm bảo đo thêm vào xuất phát từ kỹ thuật hay phương pháp vốn có trong quá trình đo. Các nguồn độ không đảm bảo đo này tác động đáng kể vào tính bất định của kết quả cuối cùng và trong hệ thống đo hiện đại nó có thể tác động mạnh hơn vào đặc tính ngẫu nhiên có được trong việc hiệu chuẩn, thu thập dữ liệu và xử lý dữ liệu do: o Tác động của nhiễu xâm nhập gây ra bởi thiết bị. (mất mát năng lượng trong quá trình truyền dữ liệu từ cảm biến đến thiết bị thu nhận dữ liệu). o Yếu tố ngoại cảnh tác động như nhiệt độ, độ ẩm môi trường (tác động lên đầu đo, bộ chuyển đổi,..) o Nhiễu điện đối với thiết bị điện tử như bởi từ trường, điện trường và những cộng hưởng nguồn lưới điện. o Sự khác nhau giữa điều kiện hiệu chuẩn và điều kiện sử dụng của thiết bị, sự suy giảm chất lượng của thiết bị theo thời gian o Kỹ năng của người thao tác, lắp đặt thiết bị và tiến hành đo đạc. Có thể thấy các yếu tố trên luôn luôn tồn tại trong quá trình đo, xử lý dữ liệu dao động kết cấu cầu đã làm cho bộ dữ liệu động thu được có đặc tính ngẫu nhiên/bất định với dải phân tán khá rộng. Do đó, việc sử dụng các phương pháp cải thiện dữ liệu thô là cần thiết để tăng độ chính xác của mô hình giám sát sức khỏe kết cấu. Đồng thời do chuỗi dữ liệu theo thời gian có kích thước rất lớn, việc phân tích xử lý dữ liệu tốn rất nhiều thời gian đặc biệt đối với kết cấu có quy mô lớn, phức tạp vì vậy việc giảm chiều dữ liệu nhằm tăng khả năng tính toán, phân tích dữ liệu một cách hiệu quả cũng rất quan trọng, cùng với đó, việc sử dụng các - 51 - phương pháp học máy (ML) để nâng cao hiệu suất chẩn đoán trở nên cần thiết và tất yếu. Theo đó, để cải thiện dữ liệu thô, giảm nhiễu, NCS nghiên cứu áp dụng phương pháp xấp xỉ tổng hợp tượng trưng (SAX) kết hợp phương pháp phân rã sóng rời rạc đa cấp (MDWD) trong bước tiền xử lý dữ liệu. Đồng thời, để phân tích dữ liệu lớn, NCS nghiên cứu áp dụng phương pháp học máy trong chẩn đoán kết cấu. Các nội dung này, NCS sẽ làm rõ trong các phần tiếp theo của luận án. 2.5 Phương pháp xấp xỉ tổng hợp tượng trưng (Symbolic Aggregate approXimation – SAX). Phương pháp SAX là một phương pháp quan trọng trong lĩnh vực xử lý dữ liệu chuỗi thời gian, đặc biệt là trong việc giảm số chiều dữ liệu và giảm thiểu sự phức tạp tính toán. Đây là một phương pháp đơn giản và hiệu quả, thường được sử dụng trong các ứng dụng như nhận dạng hành vi người dùng trên mạng, phát hiện đột biến trong chuỗi dữ liệu tài chính, dự báo giá cả thị trường chứng khoán, và các vấn đề khác liên quan đến xử lý dữ liệu chuỗi thời gian. SAX có thể được xem như là một cách để chuyển đổi dữ liệu chuỗi thời gian liên tục thành dữ liệu rời rạc bằng cách sử dụng các ký hiệu (symbol) đại diện cho các phân đoạn của dữ liệu. Điều này có thể giúp giảm số chiều dữ liệu, làm cho việc phân tích và xử lý dữ liệu trở nên dễ dàng hơn. Mỗi chuỗi ký tự rời rạc được tạo ra bởi SAX sẽ đại diện cho một phần của chuỗi dữ liệu liên tục, do đó có thể so sánh và tìm kiếm các chuỗi thời gian khác nhau dễ dàng hơn. Quá trình chuyển đổi từ dữ liệu liên tục sang dữ liệu rời rạc được thực hiện bằng cách chia chuỗi thời gian liên tục thành các đoạn sử dụng giá trị trung bình và độ lệch chuẩn của dữ liệu. Ví dụ, cho một chuỗi dữ liệu có độ dài n, nó được biến đổi thành 𝑤 ký hiệu. Quá trình này bao gồm việc chia dữ liệu chuỗi thời gian thành w đoạn có kích thước bằng nhau bằng cách sử dụng thuật toán Piecewise Aggregate Approximation (PAA). Giá trị trung bình của mỗi đoạn thời gian, được ký hiệu là - 52 - 𝑋‾ = 𝑋1̅̅ ̅, 𝑋2̅̅ ̅, , 𝑋𝑤̅̅ ̅̅ , được tính bằng cách lấy trung bình của đoạn thứ 𝑖 bằng phương trình sau (2): 𝑋�̅� = 𝑤 𝑛 ∑   (𝑛/𝑤)𝑖 𝑗 𝑋𝑗 (2.31) j= ( 𝑛 𝑤 )(𝑖 + 1) + 1 Để chia không gian thành α vùng có xác suất bằng nhau, ta sử dụng các điểm phân chia, trong đó 𝑋𝑗 đại diện cho một điểm thời gian trong chuỗi thời gian 𝑋. Việc xác định các điểm phân chia này bao gồm việc sắp xếp chúng thành một danh sách, được ký hiệu là 𝐶 = 𝑐1, 𝑐2, , 𝑐𝛼−1. Hơn nữa, các điểm phân chia này tuân theo phân phối Gaussian, và khoảng cách giữa hai điểm phân chia liên tiếp, 𝑐𝑖 và 𝑐𝑖+1, bằng 1/𝛼. Cuối cùng, chuỗi thời gian được phân đoạn được đặc trưng bằng cách sử dụng các điểm phân chia như đã đề cập. Sau đó, SAX được sử dụng để ánh xạ các giá trị trung bình của các đoạn này vào các ký tự chữ cái. Quy tắc ánh xạ của SAX được định nghĩa như sau: nếu giá trị trung bình của một đoạn rơi vào khoảng dưới giới hạn thấp nhất của các điểm phân chia tối thiểu, nó được gán ký hiệu '𝑎'. Tương tự, nếu giá trị trung bình nằm giữa giới hạn thấp nhất của các điểm phân chia thứ hai và điểm phân chia tiếp theo, nó được gán ký hiệu ' 𝑏 '. Các ký hiệu sau đó cung cấp một biểu diễn tổng quát của chuỗi thời gian gốc. Giả sử có hai chuỗi thời gian, 𝐾 và 𝑋, cả hai đều có độ dài 𝑛. Các chuỗi thời gian này được chia thành w đoạn thời gian. Sau khi áp dụng SAX, ta thu được các chuỗi ký hiệu biến đổi �ˆ� và �ˆ�. Do đó, khoảng cách SAX giữa 𝐾 và 𝑋 có thể được định nghĩa và tính toán như sau: DIST (�ˆ�, �ˆ�) = √ 𝑛 𝑤 √∑  𝑤 𝑖=1   (dist (�ˆ�, �ˆ�))2 (2.32) - 53 - Trong số đó, khoảng cách dist(�ˆ�, �ˆ�) có thể được suy ra dựa trên số lượng các ký hiệu được chọn [117]. Sau khi thực hiện quá trình chuyển đổi từ dữ liệu liên tục sang dữ liệu rời rạc sẽ thu được kết quả được minh hoạ như Hình 2.3. Hình 2.5. Ứng dụng của phương pháp SAX để giảm chiều dữ liệu Việc chọn bộ ký tự alphabet và hàm chuyển đổi phù hợp là một yếu tố quan trọng để đạt được hiệu quả cao của phương pháp SAX. Một bộ ký tự alphabet phù hợp sẽ giúp tạo ra các ký hiệu có khả năng phân biệt cao giữa các phân đoạn, trong khi một hàm chuyển đổi tốt sẽ giúp giảm thiểu sự sai số khi chuyển đổi giá trị của các phân đoạn thành các ký hiệu tương ứng. Phương pháp SAX có một số ưu điểm vượt trội như: - Giảm kích thước dữ liệu: Dữ liệu chuỗi thời gian thường có kích thước lớn vì chúng ghi nhận dữ liệu liên tục theo thời gian. Việc lưu trữ và xử lý dữ liệu chuỗi thời gian lớn có thể tốn nhiều tài nguyên tính toán và lưu trữ. SAX giúp giảm kích thước dữ liệu chuỗi thời gian bằng cách chuyển đổi chuỗi thời gian liên tục thành các ký tự (symbols) rời rạc, giúp giảm bớt dung lượng dữ liệu. - Giữ lại đặc trưng quan trọng: Một chuỗi thời gian thường chứa nhiều thông tin và đặc trưng quan trọng, chẳng hạn như xu hướng, chu kỳ, đỉnh, hay sự biến động của dữ liệu. SAX giúp giữ lại các đặc trưng quan trọng này bằng cách - 54 - chuyển đổi dữ liệu chuỗi thời gian thành các ký tự rời rạc, sao cho mỗi ký tự tương ứng với một phân đoạn của chuỗi thời gian. - Tính nhất quán và khả diễn giải: SAX tạo ra các chuỗi ký tự rời rạc có tính nhất quán và khả diễn giải. Mỗi ký tự trong chuỗi SAX tương ứng với một phân đoạn của chuỗi thời gian, với độ lớn của phân đoạn được đại diện bằng một ký tự duy nhất. Điều này giúp dễ dàng phân tích và hiểu các đặc trưng của chuỗi thời gian. - Độc lập với độ dài của chuỗi thời gian: SAX không phụ thuộc vào độ dài của chuỗi thời gian, vì nó chuyển đổi chuỗi thời gian thành các chuỗi ký tự cố định. Điều này giúp đồng nhất quy trình phân tích dữ liệu chuỗi thời gian cho các chuỗi thời gian có độ dài khác nhau, giúp cho việc so sánh, phân tích và khai thác dữ liệu chuỗi thời gian trở nên thuận tiện hơn. -Tính ứng dụng rộng rãi: SAX là một phương pháp linh hoạt và được ứng dụng trong nhiều lĩnh vực khác nhau, chẳng hạn như dự báo chuỗi thời gian, phát hiện bất thường, phân tích dữ liệu sinh học, phân tích tín hiệu nhiễu, và nhiều lĩnh vực khác. Điều này giúp cho phương pháp SAX trở thành một công cụ hữu ích trong các bài toán phân tích dữ liệu chuỗi thời gian. 2.6 Phương pháp phân rã sóng rời rạc đa cấp (Multilevel Discrete Wavelet Decomposition – MDWD) MDWD [118] là một trong những tiến bộ gần đây nhất trong phương pháp phân rã sóng rời rạc - DWT (Discrete Wavelet Transform). Nó cho phép trích xuất các đặc trưng thời gian-tần số ở nhiều mức độ khác nhau từ một chuỗi thời gian cho trước bằng cách phân rã lặp lại chuỗi thành các chuỗi con tần số thấp và cao ở mỗi mức độ. Trong xử lý ảnh, MDWD có thể được sử dụng để tách các thành phần sóng của hình ảnh và giúp xây dựng các mô hình phân tích hình ảnh. Nó cũng có thể được sử dụng để giảm nhiễu và tăng độ phân giải của hình ảnh. - 55 - Quá trình chuyển đổi dữ liệu sử dụng phương pháp MDWD được thực hiện như sau: Cho 𝑖 = {𝑖1, , 𝑖𝑡 , , 𝑖𝑇} là chuỗi thời gian đầu vào. Ở mức độ 𝑎, chuỗi con tần số thấp và tần số cao được ký hiệu lần lượt là 𝑖𝑙(𝑎) và 𝑖ℎ(𝑎). Chuyển sang mức độ (𝑎 + 1), MDWD sử dụng bộ lọc tần số thấp được ký hiệu là 𝑚 = {𝑚1, ,𝑚𝑗 , ,𝑚𝐽} và một bộ lọc tần số cao được ký hiệu là 𝑛 = {𝑛1, , 𝑛𝑗 , , 𝑛𝐽}. Để tính tích chập của chuỗi con tần số thấp ở mức độ cao hơn, 𝑃 phải nhỏ hơn 𝑇. 𝑓𝑐 𝑚(𝑎 + 1) =∑   𝑃 𝑗=1   𝑖𝑐+𝑗−1 𝑚 (𝑎) ⋅ 𝑚𝑗 (2.33) 𝑓𝑐 𝑛(𝑎 + 1) =∑   𝑃 𝑗=1   𝑖𝑐+𝑗−1 𝑛 (𝑎) ⋅ 𝑛𝑗 (2.34) Trong đó, 𝑓𝑐 𝑚(𝑎) đại diện cho phần tử thứ 𝑐 của chuỗi con tần số thấp ở mức độ 𝑎, và 𝑖𝑚(0) biểu thị cho chuỗi ban đầu đầu vào, các chuỗi con tần số thấp và tần số cao 𝑖𝑚(𝑎) và 𝑖𝑛(𝑎) được tạo ra từ quá trình lấy mẫu giảm của các chuỗi biến số trung gian 𝑣𝑚(𝑎) = {𝑣1 𝑚(𝑎), 𝑣2 𝑚(𝑎), } và 𝑣𝑛(𝑎) = {𝑣1 𝑛(𝑎), 𝑣2 𝑛(𝑎), } với hệ số giảm 0.5. Bộ sưu tập các chuỗi con, được ký hiệu là 𝑄(𝑎) = {𝑖𝑛(1), 𝑖𝑛(2), , 𝑖𝑛(𝑎), 𝑖𝑚(𝑎)}, được gọi là các kết quả phân rã ở mức độ 𝑎 của chuỗi gốc 𝑖. Đáng chú ý, 𝑄(𝑎) tuân theo các điều kiện sau: 1) 𝑄(𝑎) có khả năng tái tạo hoàn toàn chuỗi gốc i; 2) Các chuỗi con trong 𝑄(𝑎), từ 𝑖𝑛(1) đến 𝑖𝑚(𝑎), thể hiện một sự giảm dần về tần số; 3) Các lớp khác nhau trong 𝑄(𝑎) có độ phân giải thời gian và tần số khác nhau. Khi gia tăng giá trị 𝑎, độ phân giải tần số tăng lên trong khi độ phân giải thời gian, đặc biệt là đối với chuỗi con tần số thấp, giảm đi. Hình 2.6 mô tả một phân rã sóng rời rạc của tín hiệu sử dụng ba mức độ. - 56 - Hình 2.6. Phân rã sóng rời rạc ba mức độ của tín hiệu Hình 2.6 cho thấy rằng, phương pháp MDWD không chỉ giúp giảm độ phức tạp cũng như nhiễu của dữ liệu mà còn giảm kích thước của dữ liệu. 2.7 Kết luận Chương 2 Chương 2 trình bày cơ sở lý thuyết về giám sát sức khỏe kết cấu sử dụng dữ liệu chuỗi thời gian dựa trên các đặc trưng động học. Theo đó, NCS đã giới thiệu các khái niệm về dữ liệu theo thời gian, các ứng dụng của việc sử dụng dữ liệu theo thời gian trong bài toán giám sát sức khỏe kết cấu, đồng thời phân tích một số đặc trưng cơ bản của chuỗi dữ liệu theo thời gian trong giám sát sức khỏe kết cấu cầu, các yếu tố ảnh hưởng đến tính ngẫu nhiên/ bất định của dữ liệu chuỗi thời gian, cũng như vấn đề trong xử lý đối với dữ liệu lớn. Ngoài ra, trong chương này, hai phương pháp xử lý dữ liệu tiên tiến cũng được đề xuất bao gồm phương pháp SAX và MDWD để giảm độ phức tạp và kích thước của dữ liệu thu được. Có thể thấy, việc kết hợp phương pháp SAX và MDWD đã khai thác được tối đa ưu điểm của từng phương pháp trong xử lý dữ liệu chuỗi thời gian, giúp giảm nhiễu hiệu quả, nâng cao tốc độ xử lý dữ liệu, đặc biệt là các chuỗi dữ liệu quan trắc lớn đòi hỏi nguồn tài nguyên bộ vi xử lý lớn. Ứng dụng của hai phương pháp này sẽ được trình bày cụ thể trong chương 4. - 57 - CHƯƠNG 3 MẠNG HỌC SÂU TRUYỀN THỐNG VÀ MẠNG HỌC SÂU TÍCH CHẬP ỨNG DỤNG TRONG CHẨN ĐOÁN KẾT CẤU CÔNG TRÌNH CẦU 3.1 Mạng học sâu truyền thống Mạng nơ-ron (CNN – Convolutional Neural Network), là một loại mô hình học sâu để xử lý dữ liệu có dạng lưới, chẳng hạn như hình ảnh, được lấy cảm hứng từ tổ chức vỏ não thị giác của động vật [119, 120] và được thiết kế để học tự động và thích ứng các cấu trúc phân cấp không gian của các đối tượng, từ mức thấp - đến cao. CNN là một cấu trúc toán học thường bao gồm ba loại lớp: lớp chập, lớp gộp và lớp được kết nối đầy đủ. Hai lớp đầu tiên, lớp chập và lớp gộp, thực hiện trích xuất đối tượng, trong khi lớp thứ ba, một lớp được kết nối đầy đủ, ánh xạ các đối tượng được trích xuất vào đầu ra cuối cùng, chẳng hạn như phân loại. Lớp tích chập đóng một vai trò quan trọng trong CNN, lớp này bao gồm các phép toán, chẳng hạn như tích chập, một loại phép toán tuyến tính chuyên biệt. Trong hình ảnh kỹ thuật số, các giá trị pixel được lưu trữ trong lưới hai chiều (2D – Two Dimension), tức là một mảng số (Hình 3.1) và một lưới nhỏ các tham số được gọi là kernel. Kernel là một ma trận vuông kích thước 𝑘*𝑘 trong đó 𝑘 là số lẻ. 𝑘 có thể bằng 1, 3, 5, 7, 9 ,... Ví dụ kernel kích thước 3*3. Hình 3.1. Kernel kích thước 3*3 Một bộ trích xuất tính năng có thể tối ưu hóa, được áp dụng tại mỗi vị trí hình ảnh, điều này làm cho CNN có hiệu quả cao trong việc xử lý hình ảnh, vì một tính năng có thể xuất hiện ở bất kỳ đâu trong hình ảnh (Hình 3.2). - 58 - Hình 3.2. Máy tính coi một hình ảnh là một mảng số. Ma trận bên phải chứa các số từ 0 đến 255 (giá trị pixel), mỗi số tương ứng với độ sáng pixel trong hình ảnh bên trái. Hình ở giữa là hình ảnh tổng hợp của ma trận bên phải và hình ảnh bên trái. Khi một lớp cung cấp đầu ra cho lớp tiếp theo, các tính năng được trích xuất có thể phân cấp và dần dần trở nên phức tạp hơn. Quá trình tối ưu hóa các tham số như kernel được gọi là huấn luyện, được thực hiện để giảm thiểu sự khác biệt giữa đầu ra tính toán và đầu ra thực tế thông qua một thuật toán tối ưu hóa được gọi là thuật toán truyền ngược (backpropagation) dựa trên độ dốc đi xuống (gradient descent). Trên thế giới, trong những thập kỷ qua, nhiều phương pháp đang được áp dụng để giám sát sức khỏe kết cấu, trong đó phương pháp dựa trên các phương pháp học

Các file đính kèm theo tài liệu này:

  • pdfluan_an_chan_doan_ket_cau_cau_dua_tren_chuoi_du_lieu_do_dao.pdf
  • pdf02. Tom tat tieng Viet NCS H.T.Nam.pdf
  • pdf03. Tom tat tieng Anh NCS H.T.Nam.pdf
  • docx04. Thong tin luan an Tieng Viet NCS H.T.Nam.docx
  • docx05-Thong tin luan an Tieng Anh NCS H.T.Nam.docx
Tài liệu liên quan