MỤC LỤC
DANH MỤC HÌNH VẼ . v
DANH MỤC BẢNG BIỂU . viii
DANH MỤC CHỮ VIẾT TẮT . ix
MỞ ĐẦU . 1
1. Mở đầu . 1
2. Mục tiêu nghiên cứu . 7
3. Phương pháp nghiên cứu . 7
4. Đối tượng và phạm vi nghiên cứu . 8
5. Ý nghĩa khoa học và thực tiễn . 8
6. Nội dung và kết cấu của luận án . 8
CHƯƠNG 1 : TỔNG QUAN VỀ NGHIÊN CỨU CHẨN ĐOÁN SỨC KHỎE
KẾT CẤU CÔNG TRÌNH CẦU DỰA TRÊN PHƯƠNG PHÁP ĐO NHẬN
DẠNG DAO ĐỘNG . 11
1.1 Tổng quan về nghiên cứu chẩn đoán sức khỏe kết cấu công trình cầu dựa trên
phương pháp đo nhận dạng dao động . 11
1.1.1 Giới thiệu về chẩn đoán sức khỏe kết cấu công trình cầu dựa trên phương
pháp đo nhận dạng dao động . 11
1.1.2 Mục đích của chẩn đoán sức khỏe kết cấu dựa trên phương pháp đo
nhận dạng dao động . 13
1.1.3 Sự phát triển của các phương pháp chẩn đoán sức khỏe kết cấu dựa trên
phương pháp đo nhận dạng dao động . 16
1.2 Các nghiên cứu trên thế giới về chẩn đoán kết cấu dựa trên phương pháp đo
nhận dạng dao động . 21
1.3 Các nghiên cứu ở Việt Nam về chẩn đoán kết cấu dựa trên phương pháp đo
nhận dạng dao động. . 27
1.4 Kết luận Chương 1 . 30
- iii -
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT VỀ GIÁM SÁT SỨC KHỎE KẾT CẤU
SỬ DỤNG DỮ LIỆU CHUỖI THỜI GIAN DỰA TRÊN CÁC ĐẶC TRƯNG
ĐỘNG HỌC . 32
2.1 Khái niệm về dữ liệu chuỗi thời gian (Time series data) . 32
2.2 Dữ liệu chuỗi thời gian cho giám sát sức khỏe kết cấu . 34
2.3 Các loại dữ liệu chuỗi thời gian . 37
2.4 Tính bất định của dữ liệu chuỗi thời gian trong giám sát sức khỏe kết cấu cầu
. 39
2.4.1 Phương trình dao động của kết cấu [131] . 39
2.4.2 Dao động tự do [131] . 41
2.4.3 Dao động tắt dần [131] . 45
2.4.4 Đặc trưng bất định, ngẫu nhiên của chuỗi dữ liệu theo thời gian trong
giám sát sức khỏe kết cấu cầu . 47
2.5 Phương pháp xấp xỉ tổng hợp tượng trưng (Symbolic Aggregate
approXimation – SAX). . 51
2.6 Phương pháp phân rã sóng rời rạc đa cấp (Multilevel Discrete Wavelet
Decomposition – MDWD) . 54
2.7 Kết luận Chương 2 . 56
CHƯƠNG 3 MẠNG HỌC SÂU TRUYỀN THỐNG VÀ MẠNG HỌC SÂU
TÍCH CHẬP ỨNG DỤNG TRONG CHẨN ĐOÁN KẾT CẤU CÔNG
TRÌNH CẦU . 57
3.1 Mạng học sâu truyền thống . 57
3.1.1 Cấu trúc cơ bản của mạng học sâu truyền thống . 59
3.1.2 Một số mạng học sâu truyền thống . 63
3.1.3 Mạng học sâu CNN 2 chiều (2DCNN) . 63
3.1.4 Mạng học sâu CNN một chiều . 64
3.2 Mạng học sâu tích chập đề xuất . 66
3.3 Kết luận chương 3. . 73
- iv -
CHƯƠNG 4 ÁP DỤNG MẠNG HỌC SÂU TÍCH CHẬP KẾT HỢP
PHƯƠNG PHÁP SAX-MDWD ĐỂ CHẨN ĐOÁN CÁC HƯ HỎNG CHO
MÔ HÌNH CẦU . 74
4.1 Áp dụng mạng học sâu tích chập kết hợp phương pháp SAX-MDWD để chẩn
đoán các hư hỏng cho mô hình cầu thực tế . 74
4.1.1 Giới thiệu mô hình cầu . 74
4.1.2 Xử lý dữ liệu . 79
4.1.3 Kiến trúc mạng . 82
4.1.4 Huấn luyện mạng và phân tích kết quả . 84
4.2 Áp dụng mạng học sâu tích chập để chẩn đoán các hư hỏng cho mô hình cầu
trong phòng thí nghiệm . 93
4.2.1 Mô tả mô hình . 93
4.2.2 Thí nghiệm đo dao động mô hình cầu dây văng . 95
4.2.3 Phân tích xử lý số liệu . 99
4.2.4 Xử lý dữ liệu . 103
4.2.5 Các trường hợp tạo hư hỏng . 104
4.2.6 Kiến trúc mạng . 105
4.2.7 Phân tích kết quả . 107
4.3 Kết luận chương 4. . 111
KẾT LUẬN VÀ KIẾN NGHỊ . 112
TÀI LIỆU THAM KHẢO . PL1
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN . PL14
Phụ lục: Code . PL15
144 trang |
Chia sẻ: vietdoc2 | Ngày: 28/11/2023 | Lượt xem: 375 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Luận án Chẩn đoán kết cấu cầu dựa trên chuỗi dữ liệu đo dao động theo thời gian kết hợp sử dụng mạng học sâu tích chập, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
�3
⋮
𝜔𝑁}
(2.14)
Có thể chỉ ra rằng đối với các ma trận khối lượng và độ cứng xác định
dương, đối xứng, thực gắn liền với các hệ kết cấu ổn định, tất cả các nghiệm của
phương trình tần số sẽ là số thực và dương.
2.4.2.2 Phân tích hình thái dao động
Khi tần số dao động được xác định từ phương trình (2.13) các phương trình
chuyển động (2.11) có thể được biểu diễn dưới dạng
�̃�(𝑛)�̂�𝑛 = 𝟎 (2.15)
trong đó
�̃�(𝑛) = 𝐤 − 𝜔𝑛
2𝐦 (2.16)
Do đó �̃�(𝑛) biểu thị ma trận thu được bằng ma trận độ cứng trừ đi 𝜔𝑛
2𝐦; vì
nó phụ thuộc vào tần số nên nó khác nhau ở mỗi hình thái. Phương trình (2.15)
được thỏa mãn giống nhau vì tần số được đánh giá từ điều kiện này; do đó biên
độ của dao động là không xác định. Tuy nhiên, hình dạng của hệ dao động có thể
được xác định bằng cách giải tất cả các chuyển vị theo một tọa độ bất kỳ.
- 44 -
Với mục đích này , giả sử rằng phần tử đầu tiên của vectơ chuyển vị có biên
độ đơn vị ta có:
{
�ˆ�1𝑛
�ˆ�2𝑛
�ˆ�3𝑛
⋮
�ˆ�𝑁𝑛}
=
{
1
�ˆ�2𝑛
�ˆ�3𝑛
⋮
�ˆ�𝑁𝑛}
(2.17)
Ở dạng mở rộng, phương trình (2.15) khi đó có thể được viết
[
𝑒11
(𝑛)
𝑒12
(𝑛)
𝑒13
(𝑛)
⋯ 𝑒1𝑁
(𝑛)
𝑒21
(𝑛)
𝑒22
(𝑛)
𝑒23
(𝑛)
⋯ 𝑒2𝑁
(𝑛)
𝑒31
(𝑛)
𝑒32
(𝑛)
𝑒33
(𝑛)
⋯ 𝑒3𝑁
(𝑛)
𝑒𝑁1
(𝑛)
𝑒𝑁2
(𝑛)
𝑒𝑁3
(𝑛)
⋯ 𝑒𝑁𝑁
(𝑛)
]
{
1
�ˆ�2𝑛
�ˆ�3𝑛
⋯
�ˆ�𝑁𝑛}
=
{
0
0
0
⋯
0}
(2.18)
trong đó phân vùng được chỉ định tương ứng với biên độ chuyển vị chưa
được biết. Để thuận tiện, phương trình (2.18) sẽ được biểu diễn lại như sau:
[
𝑒11
(𝑛)
�̃�10
(𝑛)
�̃�01
(𝑛)
�̃�00
(𝑛)
] {
1
�ˆ�0𝑛
} = {
0
𝟎
} (2.19)
từ đó
�̃�01
(𝑛)
+ �̃�00
(𝑛)
�ˆ�0𝑛 = 𝟎 (2.20)
cũng như
𝑒11
(𝑛)
+ �̃�10
(𝑛)
�ˆ�0𝑛 = 0 (2.21)
Phương trình (2.20) có thể được giải đồng thời cho biên độ chuyển vị
�ˆ�0𝑛 = −(�̃�00
(𝑛)
)
−1
�̃�01
(𝑛)
(2.22)
Thực tế thì phương trình (2.21) và phương trình (2.22) khi giải sẽ cho ra
cùng một kết quả hay là vecctơ chuyển vị thu được trong phương trình (2.22) phải
- 45 -
thỏa mãn phương trình (2.21), điều kiện này giúp kiểm tra về tính chính xác của
lời giải. Cần lưu ý rằng không phải lúc nào cũng có thể để chuyển vị của phần tử
đầu tiên là chuyển vị là đơn vị; độ chính xác sẽ được cải thiện nếu phần tử đơn vị
được gán cho một trong các vị trí chuyển vị lớn hơn. Trình tự giải có thể được sử
dụng một cách tương tự trong mọi trường hợp chỉ bằng cách sắp xếp lại thứ tự các
hàng và cột một cách �̃�(𝑛)thích hợp.
Chuyển vị thu được từ phương trình (2.22) cùng với chuyển vị đơn vị của
thành phần thứ nhất tạo thành vectơ chuyển vị liên quan đến phương thức dao
động thứ 𝑛. Để thuận tiện, vectơ thường được biểu diễn ở dạng không thứ nguyên
bằng cách chia tất cả các thành phần cho một thành phần tham chiếu (thường là
lớn nhất). Vectơ kết quả được gọi là 𝜙𝑛 của hình thái dao động thứ 𝑛; do đó
𝝓𝑛 =
{
𝜙1𝑛
𝜙2𝑛
𝜙3𝑛
⋮
𝜙𝑁𝑛}
≡
1
�ˆ�𝑘𝑛
{
1
�ˆ�2𝑛
�ˆ�3𝑛
⋮
�ˆ�𝑁𝑛}
(2.23)
trong đó �ˆ�𝑘𝑛 là thành phần tham chiếu, được lấy làm thành phần đầu tiên ở
đây.
Hình dạng của từng 𝑁 dạng dao động có thể được tính toán bằng cùng một
quá trình tính này; ma trận vuông gồm 𝑁 các hình thái dao động sẽ được biểu diễn
bằng 𝚽 như sau:
𝚽 = [𝜙1 𝜙2 𝜙3 ⋯ 𝜙𝑁] =
[
𝜙11 𝜙12 ⋯ 𝜙1𝑁
𝜙21 𝜙22 ⋯ 𝜙2𝑁
𝜙31 𝜙32 ⋯ 𝜙3𝑁
𝜙41 𝜙42 ⋯ 𝜙4𝑁
⋯ ⋯ ⋯ ⋯
𝜙𝑁1 𝜙𝑁2 ⋯ 𝜙𝑁𝑁]
(2.24)
2.4.3 Dao động tắt dần [131]
Các điều kiện trong đó phép biến đổi tọa độ chuẩn cũng sẽ dùng để tách
các phương trình suy giảm của chuyển động. Các phương trình tọa độ chuẩn của
- 46 -
(2.7) và đạo hàm theo thời gian của nó và nhân với chuyển vị của vectơ hình thái
dao động thứ 𝑛 (𝝓𝑛
𝑇) dẫn tới:
𝝓𝑛
𝑇𝒎𝜱�̈�(𝑡) + 𝝓𝑛
𝑇𝒄𝜱�̇�(𝑡) + 𝝓𝑛
𝑇𝒌𝜱𝒀(𝑡) = 𝝓𝑛
𝑇𝒑(𝑡) (2.25)
Trong phương trình này, ma trận hình thái dao động 𝜱 (N × N) dùng để
biến đổi vectơ tọa độ tổng quát 𝑌 thành vectơ tọa độ hình học 𝑥. Các thành phần
tổng quát trong vectơ 𝑌 được gọi là tọa độ chuẩn của kết cấu. Đạo hàm bậc 2 của
chuyển vị �̈� = 𝚽�̈� (lưu ý rằng hình dạng phương thức không thay đổi theo thời
gian). Lưu ý rằng các điều kiện trực giao:
𝝓𝑚
𝑇 𝐦𝝓𝑛 = 0
𝝓𝑚
𝑇 𝐤𝝓𝑛 = 0
𝑚 ≠ 𝑛
Gây ra tất cả các thành phần ngoại trừ số hình thái dao động thứ n trong
biểu thức khối lượng và độ cứng của biểu thức (2.25) biến mất. Việc giảm tương
tự sẽ áp dụng cho biểu thức tắt dần nếu giả sử rằng điều kiện trực giao tương ứng
áp dụng cho ma trận tắt dần; nghĩa là, giả sử rằng:
𝝓𝑚
𝑇 𝑐𝝓𝑛 = 0; 𝑚 ≠ 𝑛 (2.26)
Trong trường hợp này phương trình (2.25) có thể được viết:
𝑀𝑛�̈�𝑛(𝑡) + 𝐶𝑛�̇�𝑛(𝑡) + 𝐾𝑛𝑌𝑛(𝑡) = 𝑃𝑛(𝑡) (2.27)
Trong đó các định nghĩa về khối lượng tọa độ phương thức, độ cứng và tải
trọng và hệ số giảm chấn nhớt tọa độ phương thức được xác định :
𝑀𝑛 = 𝝓𝑛
𝑇𝑚𝝓𝑛 (a)
𝐾𝑛 = 𝝓𝑛
𝑇𝑘𝝓𝑛 (b)
𝑃𝑛(𝑡) = 𝝓𝑛
𝑇𝑝(𝑡) (c)
𝐾𝑛 = 𝜔𝑛
2𝑀𝑛 (d)
𝐶𝑛 = 𝝓𝑛
𝑇𝑐𝝓𝑛 (e)
(2.28)
- 47 -
Nếu phương trình (2.27) được chia cho khối lượng tổng quát, phương trình
chuyển động dạng thức này có thể được biểu diễn dưới dạng thay thế:
�̈�𝑛(𝑡) + 2𝜉𝑛𝜔𝑛�̇�𝑛(𝑡) + 𝜔𝑛
2𝑌𝑛(𝑡) =
𝑃𝑛(𝑡)
𝑀𝑛
(2.29)
Trong đó phương trình (2.28) đã được sử dụng để viết lại số hạng độ cứng
và số hạng thứ hai ở phía bên trái thể hiện định nghĩa về tỷ số giảm chấn nhớt
phương thức:
𝜉𝑛 =
𝐶𝑛
2𝜔𝑛𝑀𝑛
(2.30)
Như đã phân tích trước đó, bằng cách sử dụng tỷ số cản cho từng hình thái
dao động theo cách này hơn là đánh giá các hệ số của ma trận tắt dần 𝐶 sẽ thuận
tiện và hợp lý hơn về mặt vật lý khi xác định hệ số tắt dần của hệ thống MDOF,
vì tỷ số tắt dần theo phương thức 𝜉𝑛 có thể là được xác định bằng thực nghiệm
hoặc ước tính với độ chính xác phù hợp trong nhiều trường hợp.
2.4.4 Đặc trưng bất định, ngẫu nhiên của chuỗi dữ liệu theo thời gian trong
giám sát sức khỏe kết cấu cầu
Chuỗi dữ liệu theo thời gian trong giám sát sức khỏe kết cấu cầu có một số
đặc trưng cơ bản sau:
Tính tương quan thời gian: Chuỗi dữ liệu theo thời gian được trích xuất từ
đặc trưng động có tính tương quan thời gian cao. Điều này có nghĩa là các giá trị
trong chuỗi dữ liệu thường có mối quan hệ với nhau theo thời gian, và những thay
đổi xảy ra tại một thời điểm có thể ảnh hưởng đến những thay đổi xảy ra tại các
thời điểm khác.
Động lực học: Chuỗi dữ liệu theo thời gian trong quan trắc cầu có tính động
lực học, tức là các giá trị trong chuỗi thường biến đổi theo thời gian, và thay đổi
này có thể do nhiều nguyên nhân như tải trọng xe cộ, thời tiết, độ ẩm, nhiệt độ,...
- 48 -
Tính chất chu kỳ: Chuỗi dữ liệu theo thời gian của quan trắc cầu thường có
tính chất chu kỳ, có nghĩa là các giá trị trong chuỗi có xu hướng lặp lại theo chu
kỳ thời gian nhất định.
Tính nhiễu: Chuỗi dữ liệu theo thời gian của quan trắc cầu có thể chứa các
điểm nhiễu do các yếu tố bên ngoài ảnh hưởng, chẳng hạn như sai số trong quá
trình đo lường hoặc do sự cố kỹ thuật.
Tính dễ bị ảnh hưởng bởi môi trường: Dữ liệu dao động thường dễ bị ảnh
hưởng bởi các yếu tố môi trường như thời tiết, tải trọng, động đất, gió, ...
Trong giám sát sức khỏe kết cấu cầu, độ chính xác của bài toán giám sát
sức khỏe thường phụ thuộc rất lớn vào chất lượng dữ liệu. Tuy nhiên, việc thu
thập dữ liệu cho bài toán này thường gặp phải nhiều thách thức, bao gồm các vấn
đề trong công tác đo đạc gây ra tính bất định của kết quả đo cũng như vấn đề xử
lý đối với dữ liệu lớn.
Theo ISO/IEC GUIDE 99 “Tính bất định là một khái niệm liên quan đến
kết quả của một phép đo lường, bao gồm cả sự biến động và sự không chắc chắn
về giá trị của kết quả. Nó được biểu thị bằng một khoảng ước tính giá trị, trong
đó giá trị của kết quả được xác định là một giá trị trung bình của một số đo lường,
và khoảng giá trị này cho phép xác định mức độ không chắc chắn của kết quả”.
Thực tế, không có phép đo nào là chính xác, khi một đại lượng được đo, kết quả
phụ thuộc vào nhiều yếu tố như hệ thống thiết bị đo, trình tự thủ tục đo, kỹ năng
của người thao tác, môi trường và các ảnh hưởng khác. Ngay cả khi đại lượng đó
được đo nhiều lần, theo cùng một cách thức và trong cùng hoàn cảnh thì mỗi lần
vẫn thường thu được giá trị đại lượng đo được khác nhau, với giả định rằng hệ
thống đo có đủ độ phân giải để phân biệt giữa các giá trị chỉ thị.
Có hai loại đại lượng sai số đo, hệ thống và ngẫu nhiên. Sai số hệ thống (độ
chệch đo) là giá trị đại lượng đo được có sự dịch chuyển. Sai số ngẫu nhiên là khi
phép đo được lặp lại thì nó thường cho giá trị đại lượng đo được khác với giá trị
- 49 -
trước đó. Trong công tác đo đạc kết cấu công trình cầu, nói chung, có thể có một
số thành phần đóng góp vào tính bất định của kết quả đo dao động, gồm:
- Độ không đảm bảo đo trong hiệu chuẩn: Thực tế, từng thiết bị đo có thể
tạo ra các độ không đảm bảo đo khác nhau. Mục đích chính của việc hiệu chuẩn
thiết bị đo là để giảm độ không đảm bảo đo đến mức có thể chấp nhận được. Quá
trình hiệu chuẩn hoàn thành mục tiêu đó bằng cách thay độ không đảm bảo đo lớn
của thiết bị chưa được hiệu chuẩn bằng sự kết hợp nhỏ hơn giữa độ không đảm
bảo đo của thiết bị điều khiển chuẩn và sự so sánh giữa nó và thiết bị đo. Như vậy,
xét về mặt kỹ thuật, bản chất của việc hiệu chuẩn chính là việc so sánh phương
tiện đo với chuẩn để đánh giá sai số và các đặc trưng kỹ thuật, đo lường khác của
nó. Hiệu chuẩn chính là biện pháp để truyền độ lớn của đơn vị đo lường từ chuẩn
có độ chính xác cao nhất tới các phương tiện đo thông thường nhằm đảm bảo tính
thống nhất và độ chính xác cần thiết của tất cả phương tiện đo.
- Độ không đảm bảo đo thu thập dữ liệu: Độ không đảm bảo đo trong hệ
thống thu thập dữ liệu có thể sinh ra từ bộ biến đổi tín hiệu, từ các cảm biến hay
thiết bị thu khác, v.v, Phương pháp tốt nhất để giảm thiểu những tác động của
nhiều nguồn độ không đảm bảo đo này là thực hiện hiệu chuẩn toàn hệ thống.
Bằng việc so sánh giá trị đầu vào đã biết với kết quả được đo của chúng, có thể
nhận được ước lượng độ không đảm bảo đo thu thập dữ liệu. Tuy vậy, không thể
luôn luôn làm điều này. Trong những trường hợp này cần phải đánh giá mỗi thành
phần của độ không đảm bảo đo và tổng hợp chúng lại để dự đoán trước độ không
đảm bảo đo tổng thể.
- Độ không đảm bảo đo xử lý dữ liệu: Các nguồn độ không đảm bảo đo
điển hình trong loại này xuất phát từ sự làm khớp đường cong và độ phân giải tính
toán. Sự làm khớp đường cong có thể được dùng để thừa nhận sự không tuyến
tính. Tuy nhiên, khi công thức được hình thành từ việc phân tích hồi quy dữ liệu
hiệu chuẩn biểu thị điểm thích hợp nhất của dữ liệu đó, sự phân bố của đường
cong chỉ ra rằng với nhiều dữ liệu, công thức ít khác nhau sẽ cho phương pháp
giống nhau như giá trị trung bình của một dãy dữ liệu sẽ thay đổi khi nhiều giá trị
- 50 -
đạt được. Như vậy, mỗi hệ số trong công thức hồi quy sẽ có một độ không đảm
bảo đo liên kết với nó.
- Độ không đảm bảo đo do các tác động ngoại cảnh
Độ không đảm bảo đo do phương pháp được xác định là các nguồn độ
không đảm bảo đo thêm vào xuất phát từ kỹ thuật hay phương pháp vốn có trong
quá trình đo. Các nguồn độ không đảm bảo đo này tác động đáng kể vào tính bất
định của kết quả cuối cùng và trong hệ thống đo hiện đại nó có thể tác động mạnh
hơn vào đặc tính ngẫu nhiên có được trong việc hiệu chuẩn, thu thập dữ liệu và
xử lý dữ liệu do:
o Tác động của nhiễu xâm nhập gây ra bởi thiết bị. (mất mát năng lượng
trong quá trình truyền dữ liệu từ cảm biến đến thiết bị thu nhận dữ
liệu).
o Yếu tố ngoại cảnh tác động như nhiệt độ, độ ẩm môi trường (tác động
lên đầu đo, bộ chuyển đổi,..)
o Nhiễu điện đối với thiết bị điện tử như bởi từ trường, điện trường và
những cộng hưởng nguồn lưới điện.
o Sự khác nhau giữa điều kiện hiệu chuẩn và điều kiện sử dụng của thiết
bị, sự suy giảm chất lượng của thiết bị theo thời gian
o Kỹ năng của người thao tác, lắp đặt thiết bị và tiến hành đo đạc.
Có thể thấy các yếu tố trên luôn luôn tồn tại trong quá trình đo, xử lý dữ
liệu dao động kết cấu cầu đã làm cho bộ dữ liệu động thu được có đặc tính ngẫu
nhiên/bất định với dải phân tán khá rộng. Do đó, việc sử dụng các phương pháp
cải thiện dữ liệu thô là cần thiết để tăng độ chính xác của mô hình giám sát sức
khỏe kết cấu. Đồng thời do chuỗi dữ liệu theo thời gian có kích thước rất lớn, việc
phân tích xử lý dữ liệu tốn rất nhiều thời gian đặc biệt đối với kết cấu có quy mô
lớn, phức tạp vì vậy việc giảm chiều dữ liệu nhằm tăng khả năng tính toán, phân
tích dữ liệu một cách hiệu quả cũng rất quan trọng, cùng với đó, việc sử dụng các
- 51 -
phương pháp học máy (ML) để nâng cao hiệu suất chẩn đoán trở nên cần thiết và
tất yếu.
Theo đó, để cải thiện dữ liệu thô, giảm nhiễu, NCS nghiên cứu áp dụng
phương pháp xấp xỉ tổng hợp tượng trưng (SAX) kết hợp phương pháp phân rã
sóng rời rạc đa cấp (MDWD) trong bước tiền xử lý dữ liệu. Đồng thời, để phân
tích dữ liệu lớn, NCS nghiên cứu áp dụng phương pháp học máy trong chẩn đoán
kết cấu. Các nội dung này, NCS sẽ làm rõ trong các phần tiếp theo của luận án.
2.5 Phương pháp xấp xỉ tổng hợp tượng trưng (Symbolic Aggregate
approXimation – SAX).
Phương pháp SAX là một phương pháp quan trọng trong lĩnh vực xử lý
dữ liệu chuỗi thời gian, đặc biệt là trong việc giảm số chiều dữ liệu và giảm thiểu
sự phức tạp tính toán. Đây là một phương pháp đơn giản và hiệu quả, thường được
sử dụng trong các ứng dụng như nhận dạng hành vi người dùng trên mạng, phát
hiện đột biến trong chuỗi dữ liệu tài chính, dự báo giá cả thị trường chứng khoán,
và các vấn đề khác liên quan đến xử lý dữ liệu chuỗi thời gian. SAX có thể được
xem như là một cách để chuyển đổi dữ liệu chuỗi thời gian liên tục thành dữ liệu
rời rạc bằng cách sử dụng các ký hiệu (symbol) đại diện cho các phân đoạn của
dữ liệu. Điều này có thể giúp giảm số chiều dữ liệu, làm cho việc phân tích và xử
lý dữ liệu trở nên dễ dàng hơn. Mỗi chuỗi ký tự rời rạc được tạo ra bởi SAX sẽ
đại diện cho một phần của chuỗi dữ liệu liên tục, do đó có thể so sánh và tìm kiếm
các chuỗi thời gian khác nhau dễ dàng hơn.
Quá trình chuyển đổi từ dữ liệu liên tục sang dữ liệu rời rạc được thực hiện
bằng cách chia chuỗi thời gian liên tục thành các đoạn sử dụng giá trị trung bình
và độ lệch chuẩn của dữ liệu.
Ví dụ, cho một chuỗi dữ liệu có độ dài n, nó được biến đổi thành 𝑤 ký hiệu.
Quá trình này bao gồm việc chia dữ liệu chuỗi thời gian thành w đoạn có kích
thước bằng nhau bằng cách sử dụng thuật toán Piecewise Aggregate
Approximation (PAA). Giá trị trung bình của mỗi đoạn thời gian, được ký hiệu là
- 52 -
𝑋‾ = 𝑋1̅̅ ̅, 𝑋2̅̅ ̅, , 𝑋𝑤̅̅ ̅̅ , được tính bằng cách lấy trung bình của đoạn thứ 𝑖 bằng
phương trình sau (2):
𝑋�̅� =
𝑤
𝑛
∑
(𝑛/𝑤)𝑖
𝑗
𝑋𝑗
(2.31)
j= (
𝑛
𝑤
)(𝑖 + 1) + 1
Để chia không gian thành α vùng có xác suất bằng nhau, ta sử dụng các
điểm phân chia, trong đó 𝑋𝑗 đại diện cho một điểm thời gian trong chuỗi thời gian
𝑋. Việc xác định các điểm phân chia này bao gồm việc sắp xếp chúng thành một
danh sách, được ký hiệu là 𝐶 = 𝑐1, 𝑐2, , 𝑐𝛼−1. Hơn nữa, các điểm phân chia này
tuân theo phân phối Gaussian, và khoảng cách giữa hai điểm phân chia liên tiếp,
𝑐𝑖 và 𝑐𝑖+1, bằng 1/𝛼.
Cuối cùng, chuỗi thời gian được phân đoạn được đặc trưng bằng cách sử
dụng các điểm phân chia như đã đề cập. Sau đó, SAX được sử dụng để ánh xạ các
giá trị trung bình của các đoạn này vào các ký tự chữ cái. Quy tắc ánh xạ của SAX
được định nghĩa như sau: nếu giá trị trung bình của một đoạn rơi vào khoảng dưới
giới hạn thấp nhất của các điểm phân chia tối thiểu, nó được gán ký hiệu '𝑎'. Tương
tự, nếu giá trị trung bình nằm giữa giới hạn thấp nhất của các điểm phân chia thứ
hai và điểm phân chia tiếp theo, nó được gán ký hiệu ' 𝑏 '. Các ký hiệu sau đó cung
cấp một biểu diễn tổng quát của chuỗi thời gian gốc.
Giả sử có hai chuỗi thời gian, 𝐾 và 𝑋, cả hai đều có độ dài 𝑛. Các chuỗi
thời gian này được chia thành w đoạn thời gian. Sau khi áp dụng SAX, ta thu được
các chuỗi ký hiệu biến đổi �ˆ� và �ˆ�. Do đó, khoảng cách SAX giữa 𝐾 và 𝑋 có thể
được định nghĩa và tính toán như sau:
DIST (�ˆ�, �ˆ�) = √
𝑛
𝑤
√∑
𝑤
𝑖=1
(dist (�ˆ�, �ˆ�))2 (2.32)
- 53 -
Trong số đó, khoảng cách dist(�ˆ�, �ˆ�) có thể được suy ra dựa trên số lượng
các ký hiệu được chọn [117].
Sau khi thực hiện quá trình chuyển đổi từ dữ liệu liên tục sang dữ liệu rời
rạc sẽ thu được kết quả được minh hoạ như Hình 2.3.
Hình 2.5. Ứng dụng của phương pháp SAX để giảm chiều dữ liệu
Việc chọn bộ ký tự alphabet và hàm chuyển đổi phù hợp là một yếu
tố quan trọng để đạt được hiệu quả cao của phương pháp SAX. Một bộ ký tự
alphabet phù hợp sẽ giúp tạo ra các ký hiệu có khả năng phân biệt cao giữa các
phân đoạn, trong khi một hàm chuyển đổi tốt sẽ giúp giảm thiểu sự sai số khi
chuyển đổi giá trị của các phân đoạn thành các ký hiệu tương ứng.
Phương pháp SAX có một số ưu điểm vượt trội như:
- Giảm kích thước dữ liệu: Dữ liệu chuỗi thời gian thường có kích thước
lớn vì chúng ghi nhận dữ liệu liên tục theo thời gian. Việc lưu trữ và xử lý dữ liệu
chuỗi thời gian lớn có thể tốn nhiều tài nguyên tính toán và lưu trữ. SAX giúp
giảm kích thước dữ liệu chuỗi thời gian bằng cách chuyển đổi chuỗi thời gian liên
tục thành các ký tự (symbols) rời rạc, giúp giảm bớt dung lượng dữ liệu.
- Giữ lại đặc trưng quan trọng: Một chuỗi thời gian thường chứa nhiều
thông tin và đặc trưng quan trọng, chẳng hạn như xu hướng, chu kỳ, đỉnh, hay sự
biến động của dữ liệu. SAX giúp giữ lại các đặc trưng quan trọng này bằng cách
- 54 -
chuyển đổi dữ liệu chuỗi thời gian thành các ký tự rời rạc, sao cho mỗi ký tự tương
ứng với một phân đoạn của chuỗi thời gian.
- Tính nhất quán và khả diễn giải: SAX tạo ra các chuỗi ký tự rời rạc có
tính nhất quán và khả diễn giải. Mỗi ký tự trong chuỗi SAX tương ứng với một
phân đoạn của chuỗi thời gian, với độ lớn của phân đoạn được đại diện bằng một
ký tự duy nhất. Điều này giúp dễ dàng phân tích và hiểu các đặc trưng của chuỗi
thời gian.
- Độc lập với độ dài của chuỗi thời gian: SAX không phụ thuộc vào độ dài
của chuỗi thời gian, vì nó chuyển đổi chuỗi thời gian thành các chuỗi ký tự cố
định. Điều này giúp đồng nhất quy trình phân tích dữ liệu chuỗi thời gian cho các
chuỗi thời gian có độ dài khác nhau, giúp cho việc so sánh, phân tích và khai thác
dữ liệu chuỗi thời gian trở nên thuận tiện hơn.
-Tính ứng dụng rộng rãi: SAX là một phương pháp linh hoạt và được ứng
dụng trong nhiều lĩnh vực khác nhau, chẳng hạn như dự báo chuỗi thời gian, phát
hiện bất thường, phân tích dữ liệu sinh học, phân tích tín hiệu nhiễu, và nhiều lĩnh
vực khác. Điều này giúp cho phương pháp SAX trở thành một công cụ hữu ích
trong các bài toán phân tích dữ liệu chuỗi thời gian.
2.6 Phương pháp phân rã sóng rời rạc đa cấp (Multilevel Discrete Wavelet
Decomposition – MDWD)
MDWD [118] là một trong những tiến bộ gần đây nhất trong phương pháp
phân rã sóng rời rạc - DWT (Discrete Wavelet Transform). Nó cho phép trích xuất
các đặc trưng thời gian-tần số ở nhiều mức độ khác nhau từ một chuỗi thời gian
cho trước bằng cách phân rã lặp lại chuỗi thành các chuỗi con tần số thấp và cao
ở mỗi mức độ. Trong xử lý ảnh, MDWD có thể được sử dụng để tách các thành
phần sóng của hình ảnh và giúp xây dựng các mô hình phân tích hình ảnh. Nó
cũng có thể được sử dụng để giảm nhiễu và tăng độ phân giải của hình ảnh.
- 55 -
Quá trình chuyển đổi dữ liệu sử dụng phương pháp MDWD được thực hiện
như sau:
Cho 𝑖 = {𝑖1, , 𝑖𝑡 , , 𝑖𝑇} là chuỗi thời gian đầu vào. Ở mức độ 𝑎, chuỗi con
tần số thấp và tần số cao được ký hiệu lần lượt là 𝑖𝑙(𝑎) và 𝑖ℎ(𝑎). Chuyển sang
mức độ (𝑎 + 1), MDWD sử dụng bộ lọc tần số thấp được ký hiệu là 𝑚 =
{𝑚1, ,𝑚𝑗 , ,𝑚𝐽} và một bộ lọc tần số cao được ký hiệu là 𝑛 =
{𝑛1, , 𝑛𝑗 , , 𝑛𝐽}. Để tính tích chập của chuỗi con tần số thấp ở mức độ cao hơn,
𝑃 phải nhỏ hơn 𝑇.
𝑓𝑐
𝑚(𝑎 + 1) =∑
𝑃
𝑗=1
𝑖𝑐+𝑗−1
𝑚 (𝑎) ⋅ 𝑚𝑗 (2.33)
𝑓𝑐
𝑛(𝑎 + 1) =∑
𝑃
𝑗=1
𝑖𝑐+𝑗−1
𝑛 (𝑎) ⋅ 𝑛𝑗
(2.34)
Trong đó, 𝑓𝑐
𝑚(𝑎) đại diện cho phần tử thứ 𝑐 của chuỗi con tần số thấp ở
mức độ 𝑎, và 𝑖𝑚(0) biểu thị cho chuỗi ban đầu đầu vào, các chuỗi con tần số thấp
và tần số cao 𝑖𝑚(𝑎) và 𝑖𝑛(𝑎) được tạo ra từ quá trình lấy mẫu giảm của các chuỗi
biến số trung gian 𝑣𝑚(𝑎) = {𝑣1
𝑚(𝑎), 𝑣2
𝑚(𝑎), } và 𝑣𝑛(𝑎) = {𝑣1
𝑛(𝑎), 𝑣2
𝑛(𝑎), }
với hệ số giảm 0.5.
Bộ sưu tập các chuỗi con, được ký hiệu là 𝑄(𝑎) =
{𝑖𝑛(1), 𝑖𝑛(2), , 𝑖𝑛(𝑎), 𝑖𝑚(𝑎)}, được gọi là các kết quả phân rã ở mức độ 𝑎 của
chuỗi gốc 𝑖. Đáng chú ý, 𝑄(𝑎) tuân theo các điều kiện sau: 1) 𝑄(𝑎) có khả năng
tái tạo hoàn toàn chuỗi gốc i; 2) Các chuỗi con trong 𝑄(𝑎), từ 𝑖𝑛(1) đến 𝑖𝑚(𝑎),
thể hiện một sự giảm dần về tần số; 3) Các lớp khác nhau trong 𝑄(𝑎) có độ phân
giải thời gian và tần số khác nhau. Khi gia tăng giá trị 𝑎, độ phân giải tần số tăng
lên trong khi độ phân giải thời gian, đặc biệt là đối với chuỗi con tần số thấp, giảm
đi. Hình 2.6 mô tả một phân rã sóng rời rạc của tín hiệu sử dụng ba mức độ.
- 56 -
Hình 2.6. Phân rã sóng rời rạc ba mức độ của tín hiệu
Hình 2.6 cho thấy rằng, phương pháp MDWD không chỉ giúp giảm độ phức
tạp cũng như nhiễu của dữ liệu mà còn giảm kích thước của dữ liệu.
2.7 Kết luận Chương 2
Chương 2 trình bày cơ sở lý thuyết về giám sát sức khỏe kết cấu sử dụng
dữ liệu chuỗi thời gian dựa trên các đặc trưng động học. Theo đó, NCS đã giới
thiệu các khái niệm về dữ liệu theo thời gian, các ứng dụng của việc sử dụng dữ
liệu theo thời gian trong bài toán giám sát sức khỏe kết cấu, đồng thời phân tích
một số đặc trưng cơ bản của chuỗi dữ liệu theo thời gian trong giám sát sức khỏe
kết cấu cầu, các yếu tố ảnh hưởng đến tính ngẫu nhiên/ bất định của dữ liệu chuỗi
thời gian, cũng như vấn đề trong xử lý đối với dữ liệu lớn.
Ngoài ra, trong chương này, hai phương pháp xử lý dữ liệu tiên tiến cũng
được đề xuất bao gồm phương pháp SAX và MDWD để giảm độ phức tạp và kích
thước của dữ liệu thu được. Có thể thấy, việc kết hợp phương pháp SAX và
MDWD đã khai thác được tối đa ưu điểm của từng phương pháp trong xử lý dữ
liệu chuỗi thời gian, giúp giảm nhiễu hiệu quả, nâng cao tốc độ xử lý dữ liệu, đặc
biệt là các chuỗi dữ liệu quan trắc lớn đòi hỏi nguồn tài nguyên bộ vi xử lý lớn.
Ứng dụng của hai phương pháp này sẽ được trình bày cụ thể trong chương 4.
- 57 -
CHƯƠNG 3 MẠNG HỌC SÂU TRUYỀN THỐNG VÀ MẠNG HỌC SÂU
TÍCH CHẬP ỨNG DỤNG TRONG CHẨN ĐOÁN KẾT CẤU CÔNG
TRÌNH CẦU
3.1 Mạng học sâu truyền thống
Mạng nơ-ron (CNN – Convolutional Neural Network), là một loại mô hình
học sâu để xử lý dữ liệu có dạng lưới, chẳng hạn như hình ảnh, được lấy cảm hứng
từ tổ chức vỏ não thị giác của động vật [119, 120] và được thiết kế để học tự động
và thích ứng các cấu trúc phân cấp không gian của các đối tượng, từ mức thấp -
đến cao. CNN là một cấu trúc toán học thường bao gồm ba loại lớp: lớp chập, lớp
gộp và lớp được kết nối đầy đủ. Hai lớp đầu tiên, lớp chập và lớp gộp, thực hiện
trích xuất đối tượng, trong khi lớp thứ ba, một lớp được kết nối đầy đủ, ánh xạ các
đối tượng được trích xuất vào đầu ra cuối cùng, chẳng hạn như phân loại. Lớp tích
chập đóng một vai trò quan trọng trong CNN, lớp này bao gồm các phép toán,
chẳng hạn như tích chập, một loại phép toán tuyến tính chuyên biệt. Trong hình
ảnh kỹ thuật số, các giá trị pixel được lưu trữ trong lưới hai chiều (2D – Two
Dimension), tức là một mảng số (Hình 3.1) và một lưới nhỏ các tham số được gọi
là kernel. Kernel là một ma trận vuông kích thước 𝑘*𝑘 trong đó 𝑘 là số lẻ. 𝑘 có
thể bằng 1, 3, 5, 7, 9 ,... Ví dụ kernel kích thước 3*3.
Hình 3.1. Kernel kích thước 3*3
Một bộ trích xuất tính năng có thể tối ưu hóa, được áp dụng tại mỗi vị trí
hình ảnh, điều này làm cho CNN có hiệu quả cao trong việc xử lý hình ảnh, vì
một tính năng có thể xuất hiện ở bất kỳ đâu trong hình ảnh (Hình 3.2).
- 58 -
Hình 3.2. Máy tính coi một hình ảnh là một mảng số. Ma trận bên phải chứa
các số từ 0 đến 255 (giá trị pixel), mỗi số tương ứng với độ sáng pixel trong
hình ảnh bên trái. Hình ở giữa là hình ảnh tổng hợp của ma trận bên phải và
hình ảnh bên trái.
Khi một lớp cung cấp đầu ra cho lớp tiếp theo, các tính năng được trích
xuất có thể phân cấp và dần dần trở nên phức tạp hơn. Quá trình tối ưu hóa các
tham số như kernel được gọi là huấn luyện, được thực hiện để giảm thiểu sự khác
biệt giữa đầu ra tính toán và đầu ra thực tế thông qua một thuật toán tối ưu hóa
được gọi là thuật toán truyền ngược (backpropagation) dựa trên độ dốc đi xuống
(gradient descent).
Trên thế giới, trong những thập kỷ qua, nhiều phương pháp đang được áp
dụng để giám sát sức khỏe kết cấu, trong đó phương pháp dựa trên các phương
pháp học