We’ve updated our privacy policy so that we are compliant with changing global privacy regulations and to provide you with insight into the limited ways in which we use your data.
You can read the details below. By accepting, you agree to the updated privacy policy.
Thank you!
View updated privacy policy
We've encountered a problem, please try again.
Tìm hiểu kỹ thuật xử lý ảnh và xây dựng ứng dụng tách ảnh ký tự từ ảnh văn bản
• Bộ lọc trung vị được dùng phổ biến, bởi vì một số loại nhiễu nhất định,
nó có thể lọc nhiễu rất tốt với độ mờ thấp so với bộ lọc tuyến tính cùng
kích thước.
Ý tưởng: Ý tưởng chính của thuật toán lọc trung vị như sau: Sử dụng
một cửa dổ lọc [ma trận 3 x 3] quét qua lần lượt từng điểm ảnh của ảnh
đầu vào input. Tại vị trí mỗi điểm ảnh lấy giá trị của các điểm ảnh tương
ứng trong vùng 3 x 3 của ảnh gốc “lấp” vào ma trận lọc. Sau đó sắp xếp
điểm ảnh nằm chính giữa [trung vị] của dãy giá trị điểm ảnh đã được sắp
xếp ở trên cho giá trị điểm ảnh đang xét của ảnh đầu ra input.
Các bước thực hiện:
• Trung vị E của một tập hợp là giá trị mà một nữa các giá trị trong tập
hợp nhỏ hơn hoặc bằng E, một nửa các giá trị trong tập hợp lớn hơn
hoặc bằng E.
• Chức năng cơ bản của bộ lọc trung vị là thiết lập trị của các điểm với
các mức xám khác nhau thành giá trị có ve như gần giống với giá trị của
điểm lân cận.
• Khi áp dụng bộ lọc trung vị có kích thước mxn, các điểm ảnh à có số
lượng các điểm lân cận cùng mức xám với nó nhỏ hơn m*n/2 sẽ không
bị ảnh hưởng, điều này khắc phục được nhược điểm làm mờ ảnh khi áp
dụng bộ lọc trung bình.
VD:
Có ma trận 3x3 như sau:
50
65
52
63
255
58
61
60
57
Các giá trị sau khi sắp xếp
50
52
57
58
60
61
63
65
255
20
Tìm hiểu kỹ thuật xử lý ảnh và xây dựng ứng dụng tách ảnh ký tự từ ảnh văn bản
Kết quả là giá trị 255 sẽ được thay thế bằng giá trị 60.
• Hạn chế của lọc trung vị là chậm do mỗi lần tính giá trị mói phải thực hiện sắp
xếp lại nxn lần.
• Tính chất của lọc trung vị:
- Có lợi cho việc loại bỏ các điểm ảnh hay các hàng mà vẫn đảm bảo
an toàn độ phân giải
- Hiệu quả giảm khi số điểm trong ma trận lớn hay bằng một nửa số
điểm trong ma trận. Điều này dễ giải thích vì trung vị là [N w + 1]/2
giá trị lớn nhất nếu Nw lẻ. Lọc trung vị trường hợp hai chiều coi như
lọc trung vị tách được theo từng chiều.
• Một số bộ lọc thường dùng:
[1,
1,
1]
[1,
[1,
8,
1]
[2,
[1,
1,
1]
[1,
Kích thước của bộ lọc [2N – 1, 2M - 1], ví dụ 3x3, 5x5…
2,
4,
2,
1]
2]
1]
Đặt tâm của bộ lọc lên điểm ảnh cần xét, không xét những điểm nằm
trên biên vùng ảnh.
2.2.
Quá trình xử lý ảnh văn bản
2.2.1. Nhị phân hóa ảnh văn bản
Trong thực tế, ảnh văn bản mà chúng ta nhận vào ban đầu để xử lý là ảnh màu.
Vì vậy để có thể thực hiện được quá trình phân tích và nhận dạng, chúng ta cần phải
chuyển chúng thành ảnh nhị phân trong đó mỗi điểm ảnh [pixel] được biểu diễn bởi
một trong 2 giá trị là 0 hoặc 255. Đầu tiên, ảnh màu nhận vào sẽ được chuyển thành
ảnh xám với các mức xám có giá trị từ 0 đến 255 dựa trên ba giá trị RED, GREEN,
BLUE của ảnh đầu vào. Từ ảnh xám này, chúng ta sẽ so sánh mức xám của từng điểm
với một ngưỡng cho trước để quyết định điểm đó sẽ là 0 hoặc 255, giá trị 0 biểu diễn
cho màu đen và 255 biểu diễn cho màu trắng.
21
Tìm hiểu kỹ thuật xử lý ảnh và xây dựng ứng dụng tách ảnh ký tự từ ảnh văn bản
Giới thiệu phương pháp OTSU:
Otsu là tên một nhà nghiên cứu người Nhật đã nghĩ ra ý tưởng cho việc tính
ngưỡng T một cách tự động [adaptive] dựa vào giá trị điểm ảnh của ảnh đầu vào
nhằm thay thế cho việc sử dụng ngưỡng cố định [fixed hay const]. Phương pháp này
cho kết quả là mỗi ảnh khác nhau có một ngưỡng tương ứng khác nhau bằng các bước
xử lý như sau:
Bước 1: Chọn một giá trị khởi tạo cho T [nên chọn giá trị mang tính công thức,
ví dụ T = [min + max] / 2, T = giá trị trung bình, ... tránh dùng các giá trị mang tính
định lượng thiết lập cứng].
Bước 2: Phân hoạch ảnh sử dụng T. kết quả của bước này sẽ tạo ra 2 nhóm điểm
ảnh: G1 chứa tất cả các điểm ảnh với giá trị [intensity] > T và G2 chứa các điểm ảnh
với giá trị [intensity]