Upload
tran-the-tung
View
325
Download
3
Embed Size (px)
Citation preview
CHƯƠNG 1 :
GIỚI THIỆU CHUNG
1.1. GIỚI THIỆU TỔNG QUÁT
Trên thế giới ngày nay nhu cầu năng lượng đang là vấn đề thời sự cho sự phát
triển của nền kinh tế và sự gia tăng dân số toàn cầu, trong đó năng lượng điện đóng
vai trò then chốt. Từ đó hệ thống điện cũng liên tục mở rộng, phát triển cả về nguồn
và các đường dây truyền tải. Do tính chất tiêu thụ điện ở các khu vực trong từng thời
điểm là khác nhau cho nên trào lưu công suất trên các đường dây truyền tải liên tục
thay đổi theo thời gian.
Kinh nghiệm vận hành hệ thống điện cho thấy tại một thời điểm trên hệ thống
có những đường dây bị quá tải trong khi các đường dây khác non tải và ngược lại. Nếu
có những biện pháp điều chỉnh thông số hệ thống điện thích hợp có thể làm thay đổi
trào lưu công suất và làm giảm quá tải cho một số đường dây mà không cần phải cải
tạo nâng cấp hệ thống điện. Việc sử dụng hiệu quả và tối ưu các nguồn cung cấp là
một vấn đề mà các nhà nghiên cứu rất quan tâm.
Vì vậy người ta đặt ra bài toán phân bố công suất tối ưu để nâng cao khả năng
tận dụng hệ thống điện hiện có. Đây là bài toán mà ngành điện lực phải tìm cách giải
quyết từ rất lâu, đã dùng nhiều thuật toán cổ điển và trí tuệ nhân tạo như Differential
Evolution , Ant Manners, Ant Colony Optimization, Genetic Algorithm, Tabu Search,
Simulated Annealing, Harmony Search, Firefly Algorithm … Trong sự phát triển của
trí tuệ nhân tạo, gần đây trong lĩnh vực công nghệ thông tin xuất hiện thuật toán PSO,
đây là thuật toán có nhiều ưu điểm và đã được ứng dụng rộng rãi vào trong rất nhiều
lĩnh vực, một trong những lĩnh vực ứng dụng của PSO là lĩnh vực hệ thống điện. Một
số nhà khoa học trên thế giới đã triển khai đưa thuật toán PSO vào ứng dụng tính toán
tối ưu trong hệ thống điện và đã cho ra những kết quả tốt hơn những giải thuật khác,
chương trình chạy nhanh hơn.
Phương pháp PSO là phương pháp dựa trên sự tối ưu bầy đàn thông qua việc đi
tìm vị trí có nhiều thức ăn nhất cho bầy đàn dựa trên kinh nghiệm của những lần tìm
kiếm trước. Mặt dù phương pháp PSO có tuổi đời còn rất trẻ mới chỉ được đề xuất lần
đầu tiên vào 1995 bởi James Kenedy và Russel C.Eberhart nhưng phương pháp PSO
đã có những đóng góp to lớn cho khoa học bởi tính hội tụ ưu việt của phương pháp
như: thuật toán đơn giản, dễ thực hiện, chương trình chạy nhanh hơn và kết quả chính
xác hơn các phương pháp khác.
1.2. MỤC TIÊU CỦA ĐỀ TÀI
Bài toán phân bố tối ưu công suất kháng (ORPD) đã có lịch sử phát triển từ rất
lâu nó có ý nghĩa vô cùng quan trọng trong quy hoạch và điều khiển hệ thống điện.
Mục đích của bài toán ORPD là để cải thiện biến dạng điện áp (Voltage Profile), cực
tiểu tổn thất công suất tác dụng trong hệ thống.
Hầu hết các phương pháp đều gặp phải 3 vấn đề chính: Một là, các phương
pháp này có thể không đưa ra được lời giải tối ưu hoặc thường bị kẹt ở lời giải tối ưu.
Hai là, tất cả các phương pháp này đều dựa trên giả định hàm mục tiêu là hàm liên tục
và khả vi mà không đúng đối với hệ thống thực tế. Ba là, các phương pháp này đều
không thể áp dụng cho các biến rời rạc.
Vì thế chỉ có thuật toán dựa trên trí thông minh nhân tạo và tiến hóa mà điển
hình là phương pháp PSO mới phù hợp với các loại bài toán này và loại trừ bỏ được
các vấn đề khó khăn trên.
1.3. TẦM QUAN TRỌNG CỦA ĐỀ TÀI
Hiện chưa có luận văn, công trình nghiên cứu trong nước về áp dụng thuật toán
Stochastic Weight Trade-off Particle Swarm Optimization (SWT_PSO) vào bài toán
phân bố tối ưu công suất kháng trong hệ thống điện. Điều này cho thấy tầm quan trọng
của nó trong việc tìm ra một lời giải tốt nhất, tối ưu nhất.
1.4. PHẠM VI NGHIÊN CỨU
1.5. NỘI DUNG LUẬN VĂN
CHƯƠNG 2:
TỔNG QUAN
1.6. TỔNG QUAN VỀ BÀI TOÁN TỐI ƯU HÓA CÔNG SUẤT PHẢN
KHÁNG
Bài toán tối ưu hóa công suất phản kháng có thể chia làm hai loại, tùy theo lĩnh
vực áp dụng:
Quy hoạch: Xác định dung lượng định mức và vị trí đặt tối ưu của thiết
bị bù Công suất phản kháng trong hệ thống điện.
Vận hành: Xác định giá trị đặt của các phần tử lien quan đến công suất
phản kháng như: Kích thích máy phát, máy biến áp có điều chỉnh dưới
tải, tụ bụ và các thiết bị FACTS.
Trong lĩnh vực vận hành, sau khi đã xác định công suất tác dụng đã phân phối
cho các nhà máy điện từ bài toán ED, bài toán tối ưu hóa công suất phản kháng được
sử dụng để cực tiểu tổn thất công suất tác dụng đồng thời đảm bảo điện áp tại các nút
trong hệ thống nằm trong phạm vi cho phép.
1.7. TỔNG QUAN CÁC PHƯƠNG PHÁP GIẢI ĐÃ ĐƯỢC ÁP DỤNG
2.2.1 Phương pháp DE (Differential Evolution)
Bài báo [] trình bày ứng dụng giải thuật DE vào việc giải bài toán phân bố
công suất tối ưu. DE là một thuật toán tiến hóa được đề xuất bởi Storn and Price vào
năm 1997. Phương pháp DE cho thấy hiệu quả trong việc giải quyết bài toán tối ưu
không tuyến tính với nhiều ràng buộc. DE có ưu điểm hơn các phương pháp tiến hóa
khác đó là cấu trúc đơn giản, gọn, ít thông số điều khiển, điểm hội tụ cao.Hàm mục
tiêu có dạng bậc hai dùng để tính toán là cực tiểu chi phí nhiên liệu máy phát với các
ràng buộc giới hạn công suất thực và công suất phản kháng máy phát, điện áp các nút,
đầu phân áp và dòng công suất trên các đường dây. Phương pháp đề xuất được ứng
dụng vào giải mạng điện IEEE 30 nút và kết quả được so sánh với các phương pháp:
EP, TS, SA.
2.2.2 Phương pháp AM (Ant Manners )
Bài báo [] trình bày phương pháp tính toán dựa trên hành vi của đàn kiến và
cách thu nhận tin tức của chúng. Phương pháp này được ứng dụng vào việc giải bài
toán phân bố công suất tối ưu để cực tiểu chi phí nhiên liệu máy phát với các ràng
buộc giới hạn công suất thực và công suất phản kháng máy phát, điện áp các nút, đầu
phân áp, tụ bù và dòng công suất trên các đường dây. Mô hình lựa chọn để tính toán là
mạng điện IEEE 30 nút và kết quả được so sánh với các phương pháp EP, GA.
2.2.3 Phương pháp ACO (Ant Colony Optimization)
Một trong những phương pháp tiến hóa dựa trên trí thông minh nhân tạo được
giới thiệu gần đây là phương pháp ACO được đề xuất bởi Marco Dorigo năm 1992.
ACO đưa ra cách tiếp cận mới mạnh mẽ và hiệu quả hơn cho những bài toán
tối ưu hóa phức tạp, thuật toán này tiêu biểu cho việc sử dụng mô hình xác suất để tìm
ra lời giải tối ưu. Phương pháp này dựa trên cách cử xử của đàn kiến đi tìm thức ăn.
Trong khi tìm thức ăn các cá thể kiến tự động khởi tạo xung quanh khu vực tổ của
chúng các thói quen riêng. Ngay khi có 1 cá thể kiến tìm được nguồn thức ăn, nó sẽ
đánh giá chất lượng và số lượng thức ăn đó và mang về tổ số thức ăn tìm được. Trong
suốt quá trình quay về tổ cá thể kiến này sẽ để lại trên lối về loại pheromone do nó tiết
ra. Lượng pheromone để lại có thể phụ thuộc vào chất lượng và số lượng thức ăn,
lượng pheromone này sẽ dẫn các cá thể kiến khác tới nguồn thức ăn này. Sự truyền
đạt không trực tiếp này giữa các cá thể kiến qua chất pheromone để lại trên lối mòn
cho phép chúng tìm được đường đi ngắn nhất giữa tổ của chúng và nguồn thức ăn đó.
Nói chung phương pháp ACO giải quyết bài toán tối ưu hóa bằng cách lặp lại 2
bước sau:
Lời giải ứng viên được xây dựng dựa trên mô hình chất đ pheromone
đặc trưng của loài kiến mà sự phân bố tần suất được thông số hóa qua
không gian bài toán.
Lời giải ứng viên được sử dụng để thay đổi các giá trị của chất đặc trưng
với cách mà được nghĩ rằng thiên về sự lấy mẫu hơn là về lời giải chất
lượng cao.
Phương pháp ACO được ứng dụng thành công trong nhiều bài toán khác nhau
như: bài toán người bán hàng du lịch, định tuyến xe cộ, mạng lưới viễn thông…
2.2.4 Phương pháp GA (Genetic Algorithm)
Bài báo [] trình bày việc giải bài toán phân bố công suất tối ưu trong mạng điện
lớn sử dụng phương pháp giải thuật gen. Thuật toán GA(Genetic Algorithm) được
phát minh bởi Holland vào đầu những năm 1970 là phương pháp tìm kiếm toàn cục
ngẫu nhiên mà dựa theo sự đánh giá di truyền tự nhiên GA hoạt động trên quần thể
của những lời giải ứng viên giải mã chuỗi hữu hạn gọi là nhiễm sắc thể(NST). Thông
thường các kết quả này được biểu diễn dưới dạng chuỗi số nhị phân hoặc các ký hiệu
mã hóa khác được gọi là nhiễm sắc thể. Để thu được sự tối ưu, mỗi NST phải trao đổi
thông tin bằng cách sử dụng những toán tử mượn từ gen tự nhiên để làm ra lời giải tối
ưu.Hàm mục tiêu dùng để tính toán là cực tiểu chi phí nhiên liệu máy phát với các
ràng buộc công suất máy phát, điện áp các nút, tụ bù, đầu phân áp nằm trong giới hạn
cho phép. Thời gian tính toán có thể giảm xuống bằng cách phân chia các ràng buộc
tối ưu thành ràng buộc tích cực để thao tác trực tiếp bằng giải thuật GA, duy trì các
ràng buộc thụ động trong giới hạn mềm sử dụng bài toán dòng công suất truyền thống.
Mạng IEEE 30 nút được ứng dụng để kiểm tra sự hiệu quả của giải thuật. Kết quả
được so sánh với các cách giải khác của giải thuật GA và phương pháp EP.
GA có nhiều ưu điểm trong tính toán, như đơn giản và tổng quát hóa. Ngoài ra,
nó còn tìm ra nhiều kết quả một cách đồng thời mà các phương pháp thông thường
không làm được. Vì thế, khả năng tìm ra kết quả tối ưu toàn cục được nâng lên. Ưu
điểm chính của GA là tìm ra kết quả gần tối ưu trong thời gian ngắn so với các
phương pháp dò tìm ngẫu nhiên khác như Simulated annealing (SA) hay Qui hoạch
động (DP) … Tuy nhiên, GA phụ thuộc nhiều vào hàm tương thích, nhạy với tỉ lệ lai
và đột biến, sơ đồ mã hóa các bit của nó, và độ dốc của đường cong không gian dò tìm
dẫn đến lời giải. GA đã được cải tiến và kiểm chứng trong bài toán điều độ kinh tế hệ
thống điện với nhiều dạng khác nhau cho thấy kết quả khá tốt.
2.2.5 Phương pháp TS (Tabu Search)
Phương pháp TS là phương pháp tìm kiếm để tìm giải pháp tối ưu dựa trên bộ
nhớ linh động của máy tính. Phương pháp ra đời năm 1986 bởi Fred W. Glover. Đầu
tiên TS chọn kết hợp tất cả các hàm chi phí của các tổ máy. Kết quả tính toán được mã
hóa ở dạng thập phân và được lưu vào bộ nhớ máy tính. Ưu đểm của TS là thời gian
tính toán nhỏ. Phương pháp này đã được chứng minh là giải quyết tốt bài toán điều độ
kinh tế với nhiều ràng buộc khác nhau.
Sự thuận lợi của thuật toán TS là việc nó sử dụng sự ghi nhớ uyển chuyển của
lịch sử tìm kiếm để ngăn ngừa dao động và tránh bị kẹt ở giá trị tối ưu cục bộ. TS có
thể giải quyết được các bài toán không lồi, không phẳng…
2.2.6 Phương pháp SA (Simulated Annealing)
SA(Simulated Annealing) là phương pháp được đề xuất bởi Kirt Patrick, Gelatt
và Vecchi năm 1983. SA đã được kiểm chứng trong một số bài toán tối ưu hóa và cho
kết quả rất tốt.
SA là phương pháp dựa trên việc tìm kiếm cục bộ mỗi bước di chuyển được
chấp nhận nếu cải thiện được năng lượng hệ thống. Một lời giải khác có thể chấp tùy
theo tiêu chí tần suất mà sự phân bố tần suất dựa trên quy trình luyện kim và chúng
được thu lại như hàm nhiệt độ của hệ thống.
Chiến thuật SA khởi đầu với nhiệt độ cao đưa ra tần suất phân bố cao để chấp
nhận với các bước di chuyển không được cải thiện. Nhiệt độ và mức độ phân bố giảm
bớt đáng kể như sự cải thiện của thuật toán về lời giải tối ưu.
2.2.7 Phương pháp HS (Harmony Search)
Thuật toán HS mô phỏng ngẫu hứng của người nhạc sĩ để tìm kiếm một sự hài
hòa, được đề xuất bởi Geem năm 2001. Thuật toán HS cải tiến để giải quyết bài toán
ED với nhiều ràng buộc cho thấy kết đầy quả hứa hẹn. Tuy nhiên thời gian tính toán
vẫn còn lâu.
2.2.8 Phương pháp FA (Firefly Algorithm)
Lấy cảm hứng từ hành nhấp nháy của đom đóm, FA được đề xuất bởi Xin-She
Yang vào năm 2008. Các kết quả thử nghiệm cho thấy tính hiệu quả của thuật toán FA
trong bài toán ED đa mục tiêu với nhiều ràng buộc phức tạp. FA phụ thuộc nhiều các
thông số lựa chọn. Đây là thuật toán mới, hứa hẹn vì thuật toán đơn giản và cho kết
quả nhanh hơn các thuật toán trước đó.
2.2.9 Phương pháp particle swarm optimization
Bài báo [] trình bày giải thuật PSO cho phân bố công suất phản kháng và điều
khiển ổn định điện áp. Đề xuất một phương pháp điều khiển biến liên tục và gián đoạn
như là giá trị hoạt động AVR, vị trí nấc OLTC và giá trị công suất phản kháng cần bù.
Trường hợp 1: xem xét ổn định điện áp sử dụng kỹ thuật dòng công suất liên
tục. Tính khả thi của phương pháp đề xuất được chứng minh trên mô hình hệ thống
điện với kết quả khả quan.[]
Trường hợp 2: xem xét vấn đề an ninh điện áp trong hệ thống điện sử dụng
phân bố công suất liên tục. Tính khả thi của phương pháp đề xuất được chứng minh
trên kỹ thuật phân tích ngẫu nhiên và so sánh với phương pháp tìm kiếm RTS
(Reactive Tabu Search) và phương pháp liệt kê trên mô hình hệ thống điện với kết quả
khả quan.[]
Trường hợp 3: phân bố công suất tối ưu có ràng buộc quá độ - ổn định điện áp
được xem như là dạng mở rộng của bài toán phân bố công suất tối ưu với thêm vào
ràng buộc bất đẳng thức góc của rotor. Trong trường hợp này, hàm mục tiêu được xem
xét là hàm cực tiểu chi phí nhiên liệu của hệ thống.[]
CHƯƠNG 3 :
GIỚI THIỆU VỀ PHƯƠNG PHÁP PSO
1.8. GIỚI THIỆU
Thuật toán PSO (Particle Swarm Optimization) - tối ưu bầy đàn (tạm dịch)
là một trong những thuật toán xây dựng dựa trên khái niệm trí tuệ bầy đàn để tìm kiếm
lời giải cho các bài toán tối ưu hóa trên một không gian tìm kiếm nào đó. PSO là một
dạng của các thuật toán tiến hóa quần thể đã được biết đến trước đây như giải thuật di
truyền (GA) , Thuật toán đàn kiến (ACO) . Tuy vậy PSO khác với GA ở chỗ nó thiên
về sử dụng sự tương tác giữa các cá thể trong một quần thể để khám phá không gian
tìm kiếm. PSO là kết quả của sự mô hình hóa việc đàn chim bay đi tìm kiếm thức ăn
cho nên nó thường được xếp vào loại thuật toán có sử dụng trí tuệ bầy đàn. PSO được
giới thiệu vào năm 1995 tại một hội nghị của IEEE bởi James Kennedy và Russell C.
Eberhart . Thuật toán có nhiều ứng dụng quan trọng trong tất cả các lĩnh vực mà ở đó
đòi hỏi phải giải quyết các bài toán tối ưu hóa.
Để hiểu rõ thuật toán PSO ta hãy xem một ví dụ đơn giản về quá trình tìm kiếm
thức ăn của một đàn chim. Không gian tìm kiếm thức ăn lúc này là toàn bộ không gian
ba chiều mà chúng ta đang sinh sống. Tại thời điểm bắt đầu tìm kiếm cả đàn bay theo
một hướng nào đó, có thể là rất ngẫu nhiên. Tuy nhiên sau một thời gian tìm kiếm một
số cá thể trong đàn bắt đầu tìm ra được nơi có chứa thức ăn. Tùy theo số lượng thức
ăn vừa tìm kiếm, mà cá thể gửi tín hiệu đến các cá thể khác đang tìm kiếm ở vùng lân
cận, tín hiệu này nhanh chóng lan truyền trên toàn quần thể. Dựa vào thông tin nhận
được mỗi cá thể sẽ điều chỉnh hướng bay và vận tốc theo hướng về nơi có nhiều thức
ăn nhất. Cơ chế truyền tin như vậy thường được xem như là một kiểu hình của trí tuệ
bầy đàn. Cơ chế này giúp cả đàn chim tìm ra nơi có nhiều thức ăn nhất trên không
gian tìm kiếm vô cùng rộng lớn. Như vậy đàn chim đã dùng trí tuệ, kiến thức và kinh
nghiệm của cả đàn để nhanh chóng tìm ra nơi chứa thức ăn. Bây giờ chúng ta tìm hiểu
làm cách nào mà một mô hình trong sinh học như vậy có thể áp dụng trong tính toán
và sinh ra thuật toán PSO mà chúng ta từng nhắc đến. Việc mô hình hóa này thường
được gọi là quá trình phỏng sinh học (bioinspired) mà chúng ta thường thấy trong
các ngành khoa học khác. Một thuật toán được xây dựng dựa trên việc mô hình hóa
các quá trình trong sinh học được gọi là thuật toán phỏng sinh học (bioinspired
algorithms).
Hãy xét bài toán tối ưu của hàm số F trong không gian n chiều. Mỗi vị trí trong
không gian là một điểm tọa độ n chiều. Hàm F là hàm mục tiêu xác định trong không
gian n chiều và nhận giá trị thực. Mục đích là tìm ra điểm cực tiểu của hàm F trong
miền xác định nào đó. Ta bắt đầu xem xét sự liên hệ giữa bài toán tìm thức ăn với bài
toán tìm cực tiểu của hàm theo cách như sau. Giả sử rằng số lượng thức ăn tại một vị
trí tỉ lệ nghịch với giá trị của hàm F tại vị trí đó. Có nghĩa là ở một vị trí mà giá trị
hàm F càng nhỏ thì số lượng thức ăn càng lớn. Việc tìm vùng chứa thức ăn nhiều nhất
tương tự như việc tìm ra vùng chứa điểm cực tiểu của hàm F trên không gian tìm
kiếm.
1.9. BIỂU THỨC CƠ BẢN CỦA THUẬT TOÁN PSO
Phương pháp Particle Swarm Optimization (PSO) là kỹ thuật tối ưu hóa được
phái triển bởi Kennedy và Eberhart vào năm 1995. Động cơ thúc đẩy sự phát triển
của phương pháp này dựa trên sự mô phỏng xã hội của các động vật cấp thấp như cá,
chim, v.v.
Giống như những phương pháp tối ưu dựa trên mô hình dân cư khác như GA,
PSO bắt đầu bằng một trường hợp ngẫu nhiên của các cá thể của cộng đồng dân cư
trong không gian tìm kiếm. Tuy nhiên, không giống với các phương pháp tiến hóa
khác, trong PSO không có sự kết nối giữa các phần tử di truyền trong quá trình tìm
kiếm, thuật toán PSO làm việc dựa trên ứng xử xã hội của các phần tử trong nhóm. Vì
vậy, kết quả tối ưu toàn cục do sự hiệu chỉnh quỹ đạo của các cá thể sẽ dẫn đến vị trí
tốt nhất và phần tử tối ưu nhất trong nhóm sau mỗi lần bước tính. Phương pháp PSO
đang trở nên phổ biến vì tính đơn giản và khả năng hội tụ nhanh chóng đạt kết quả tốt.
Trong thuật toán particle swarm (tạm dịch là bầy nhóm), quỹ đạo của mỗi cá
thể trong không gian tìm kiếm được hiệu chỉnh bằng cách thay đổi vận tốc của từng cá
thể, thông qua kinh nghiệm bay của nó và kinh nghiệm bay của những cá thể khác
trong không gian tìm kiếm. Vector vị trí và vector vận tốc của một cá thể thứ i trong
không gian d chiều là:
Thông qua cách đặt hàm định nghĩa, chúng ta sẽ tìm ra được giá trị phù hợp
nhất đạt được bởi một phần tử tại thời điểm t là: và cá thể phù
hợp nhất tại thời điểm t là . Sau đó, vận tốc mới và vị trí mới
của các cá thể được tính toán bằng 2 biểu thức sau:
(3.1)
(3.2)
Trong đó
c1, c2 là những hằng số gia tốc.
rand(.) và Rand (.) là dạng tạo số ngẫu nhiên trong đoạn [0,1] (2 hàm này có
mối liên hệ đồng dạng với nhau).
Phần đầu tiên trong công thức (3.1) đại diện cho vận tốc trước đó, để tạo đà cho
cá thể tiếp tục đi lang trong không gian tìm kiếm. Thành phần thứ 2, được xem là
thành phần “cognitive”, đại diện cho suy tính nhân tạo của các cá thể, chính thành
phần này sẽ hướng các cá thể đến vi trí tốt nhất của nó. Thành phần thứ 3 được xem là
thành phần “xã hội”, nó đại diện cho hiệu ứng “colaborative” của các cá thể trong quá
trình tìm kiếm lời giải tối ưu toàn cục. chính thành phần xã hội sẽ lôi kéo các cá thể
hướng đến giá trị tối ưu toàn cục.
Ban đầu các cá thể sẽ được tạo ra với 1 vị trí ngẫu nhiên, sau đó các vận tốc
ngẫu nhiên được ấn định cho từng cá thể. Sự phù hợp của các cá thể được ước lượng
thông qua hàm mục tiêu. Ở mỗi thời kỳ, vận tốc của từng cá thể được tính toán thông
qua (1) và vị trí trong lần ước lượng tới được cập nhật bằng (3.2). Sau mỗi khoảng
thời gian nếu các cá thể tìm ra vị trí tối ưu hơn vị trí trước thì vị trí của nó được lưu
vào bộ nhớ. Một cách khái quát, vận tốc lớn nhất ( ) cho mỗi module của vector
vận tốc của các cá thể được định nghĩa để điều khiển phạm vi của các cá thể trong
không gian tìm kiến cho người dùng tự định nghĩa.
1.10. MỘT SỐ CẢI TIẾN QUAN TRỌNG TRONG QUÁ TRÌNH PHÁT
TRIỂN CỦA PSO
3.3.1. Dạng Constriction PSO
Vào nằm 2002, Clerc và Kennedy đã chứng tỏ rằng một hệ số co có thể giúp
tăng cường tốc độ hội tụ. Hệ số co đó được tạo thành bằng sự kết hợp giữa các giá trị
c1 và c2. Khi đó, dạng constriction PSO có biểu thức như sau:
(3.3)
Trong đó: được gọi bằng hệ số co, được xác định bởi biểu thức:
với (3.4)
Thông thường giá trị c1 và c2 được chọn bằng nhau và bằng 2.05 và khi đó
=0.7298. Dạng constriction PSO đã được áp dụng cho nhiều lĩnh vực khác nhau và
trở thành một trong những dạng PSO được sử dụng rộng rãi nhất. Về sau, Eberhart và
Shi đã đặt lại trọng số quán tính thay vì sử dụng hệ số co , mở đường cho sự ra đời
phương pháp PSO – TVIW.
3.3.2. PSO – TVIW
Shi và Eberhart đã giới thiệu ý tưởng về trọng số quán tính thêm vào phiên bản
chuẩn của PSO nhằm cân bằng kết quả cục bộ và toàn cục trong quá trình tìm kiếm.
Biểu thức toán của ý tưởng này được thể hiện như sau:
(3.5)
Trong đó được cho bởi công thức: (3.6)
Với 1 và 2 là giá trị đầu và giá trị cuối của trọng số quán tính. “iter” là vòng
lặp hiện tại và “MAXITER” là giá trị lớn nhất của vòng lặp có thể chấp nhận được.
Phương pháp này được gọi là PSO – TVIW. Kết quả nghiên cứu cho thấy PSO –
TVIW tỏ ra không hiệu quả cho các bài toán có dạng “tracking dynamic systems”.
Thay vào đó, đối với các ứng dụng dynamic trong tự nhiên, họ đã đề xuất một trọng số
quán tính ngẫu nhiên cho tracking dynamic system.
(3.7)
Phương pháp này được gọi là PSO – RANDIW.
Cả 2 phương pháp trên đều pháp triển PSO theo hướng TVIW. Tuy PSO –
TVIW có thể cho kết quả tối ưu tốt nhưng khi so sánh với với các thuật toán tiến hóa
khác, thì khả năng tìm kiếm đáp án đúng của nó lại khá thấp.
3.3.3. Kỹ thuật TVAC
Như đã phân tích ở trên, phương pháp PSO tìm kiếm giải pháp tối ưu được dựa
trên 2 thành phần gia tốc. Vì vậy, sự điều khiển thích hợp của 2 thành phần đó rất
quan trọng để tìm ra giải pháp tối ưu một cách chính xác và hiệu quả.
Kennedy và Eberhart đã mô tả rằng một giá trị tương đối cao của thành phần
cognitive, so với thành phần social, sẽ tạo ra kết quả lạc lối của các cá thể trong không
gian tìm kiếm. Ngược lại, với giá trị tương đối cao của thành phần social sẽ dẫn các cá
thể đến lời giải cục bộ. Do đó, họ đã đề nghị cách thiết lập cả 2 thành phần gia tốc như
biểu thức (3.2), khi đó giá trị trung bình của 2 thành phần sẽ thống nhất với nhau, vì
vậy các cá thể chỉ cần bay một nửa thời gian tìm kiếm. Kể từ đó, đề xuất này được sử
dụng cho hầu hết các nghiên cứu.
Suganthan đã kiểm tra một phương pháp giảm tuyến tính của cả 2 hệ số gia tốc
theo giời gian, nhưng kết quả cho thấy hệ số gia tốc được cho bởi biểu thức (3.2) vẫn
cho giá trị tốt hơn. Tuy nhiên, thông qua nghiên của mình ông ấy đã cho thấy rằng hệ
số gia tốc không nhất thiết phải lúc nào cũng bằng biểu thức (3.2).
Một cách khái quát, trong các thuật toán tối ưu dựa vào cộng đồng, ta mong
muốn khuyến khích các cá thể đi khắp nơi trong không gian tìm kiếm mà không tụm
lại tại quanh những giá trị tối ưu cục bộ trong giai đoạn đầu của quá trình tối ưu. Bên
cạnh đó, trong những giai đoạn sau, điều quan trọng là phải tăng cường sự hội tụ về
giá trị tối ưu toàn cục nhằm kiếm lời giải một cách có hiệu quả.
Một kỹ thuật tăng cường cho PSO được giới thiệu là TVAC (time-varying
acceleration coefficients). Mục tiêu của sự cải tiến này là nhằm tăng cường tìm kiếm
lời giải toàn cục trong giai đoạn đầu của quá trình tối ưu và khuyến khích các cá thể
hội tụ về giá trị tối ưu toàn cục trong giai đoạn cuối của quá trình tìm kiếm.
Với kỹ thuật TVAC này, giá trị của thành phần cognitive sẽ giảm trong khi
thành phần social được tăng lên, bằng cách thay đổi hệ số c1 và c2 theo thời gian. Bằng
cách khởi đầu bằng thành phần cognitive có giá trị lớn và thành phần social có giá trị
nhỏ, các cá thể sẽ được phép di chuyển khắp nơi trong không gian tìm kiếm, thay vì đi
thẳng đến điểm tối ưu. Bên cạnh đó, với giá trị nhỏ của thành phần cognitive và giá trị
lớn của thành phần social cho phép các cá thể hướng đến giá trị tối ưu toàn cục trong
giai đoạn sau của quá trình tối ưu. Ngoài ra, hệ số TVIW cũng được sử dụng theo biểu
thức (3.4). Như vậy biểu toán của thuật toán PSO – TVAC như sau:
(3.8)
(3.9)
Trong đó:
c1i, c1f, c2i, c2f là những hằng số.
iter là vòng lặp hiện tại.
MAXITR là số vòng lặp cực đại cho phép.
Bằng thực nghiệm, giá trị c1 thay đổi từ 2.5 đến 0.5 và giá trị c2 thay đổi từ 0.5
đến 2.5 là cho kết quả tối ưu tốt hơn cả.
3.3.4. MPSO – TVAC
Trong PSO, sự thiếu phong phú của cộng đồng, đặc biệt trong giai đoạn cuối
của quá trình tối ưu, được hiểu như là sự vội vã khi đánh giá hệ số vượt trội của kết
quả hội tụ so với các giá trị tối ưu cục bộ. Gần đây, một vài cố gắng nhằm tăng tính
phong phú của cộng đồng đã được báo cáo, thông qua cách ứng xử của các cá thể
trong bầy đàn khi tìm kiếm. Xa hơn nữa, có thể sử dụng sự đột biến trong PSO (giống
như trong thuật toán di truyền) như là một kỹ thuật tăng cường. Sau đây là thuật toán
MPSO tăng cường khả năng tìm kiếm toàn cục bằng cách tăng tính phong phú.
Trong PSO, sự tìm kiếm hướng đến giải pháp tối ưu toàn cục được cho bởi 2 hệ
số gia tốc. Vì vậy, Angeline đã liên kết 2 hệ số gia tốc đó với hàm đột biến trong thuật
toán tiến hóa, trong khi đó, Shi và Eberthard liên kết 2 hệ số đó với hành vi lai giống
trong thuật toán di truyền.
Kết quả số mô phỏng cho thấy PSO tìm kiếm giải pháp cục bộ tốt hơn nhưng
đôi khi vẫn còn một kết quả tối ưu cục bộ có số vòng lặp lớn không được tìm ra. Vì
vậy để điều khiển trường hợp này, chúng ta tăng cường quá trình tìm kiếm toàn cục
bằng cách thực hiện sự đột biến, tương tự như sự đột biến trong thuật toán di truyền.
Với chiến lược mới này, khi giải pháp tối ưu toàn cục không cải tiến do số lần lặp tăng
lên, một cá thể sẽ được lựa chọn ngẫu nhiên sau đó một giá trị “lộn xộn” (kích thước
đột biến) được cộng thêm vào module vận tốc được lựa chọn ngẫu nhiên theo một quy
luật xác suất được định trước. Pseudocode cho thuật toán MPSO như sau:
Trong đó:
randi(.) độc lập với nhau, tạo ra các giá trị ngẫu nhiên đồng dạng trong
khoảng [0,1].
Pm là xác suất đột biến
global là mức cải tiến của giải pháp toàn cục.
m, k, l là những hằng số.
3.3.5. SOHPSO – TVAC
Theo những nghiên cứu trước, sự phát triển của PSO đều dựa trên trọng số
quán tính, với một hệ số quán tính được điều chỉnh tuyến tính hoặc một hệ số co nào
đó. Tuy nhiên, Shi và Eberthart đã đề nghị một hàm phức tạp đa phương thức, sự điều
chỉnh tính phong phú của cộng đồng bằng một hệ số quán tính tuyến tính có thể dẫn
các cá thể hội tụ đến một giá trị tối ưu cục bộ. Mặt khác, quá trình nghiên cứu của
Eberthard và Shi cho thấy phương pháp hệ số co không ảnh hưởng đến hàm phức tạp
đa phương thức.
Ngược lại, Kennedy và Eberthard đã đề nghị một phiên bản PSO mà không có
vận tốc của vòng lặp trước (biểu thức 3.1). Sau đó, họ kết luận rằng phiên bản PSO
này rất đơn giản, nó không ảnh hưởng nhiều trong quá trình tìm kiếm giải pháp tối ưu
toàn cục cho hầu hết các vấn đề phức tạp.
Chúng ta quan sát cách ứng xử của các cá thể trong cộng đồng mà không có
biểu thức hồi quy vận tốc (3.1). Khi không có biểu thức (3.1) các cá thể nhanh chóng
đổ xô về giá trị tối ưu cục bộ và động ứ lại do thiếu đà. Thật vậy, khi không có biểu
thức vận tốc, giải pháp tối ưu phục thuộc nhiều vào giá trị đầu vào của cộng đồng.
Phương pháp SOHPSO sẽ cung cấp động lượng cần thiết cho các cá thể tìm ra
giải pháp tối ưu toàn cục mà không cần đến biểu thức vận tốc.
Với phương pháp này, ta giữ thành phần ban đầu bằng 0 và khởi động lại
module vận tốc của cá thể với một giá trị vận tốc ngẫu nhiên trong không gian tìm
kiếm. Vì vậy, với phương pháp này, một chuỗi các giá trị tối ưu sẽ được tự động tạo ra
thông qua cách ứng xử của cá thể trong không gian, cho đến khi tiêu chuẩn hội tụ đạt
được.
Trong đó randi(.) là những hàm ngẫu nhiên độc lập nhau và v là vecto vận tốc
khởi động lại.
3.3.6. Sự kết hợp giữa phương pháp PSO và các phương pháp tối ưu khác
Bên cạnh những cải tiến về mặt bản chất của phương pháp PSO, một hướng
tiếp cận khác nhằm nâng cao hiệu quả của phương pháp này là sự kết hợp giữa PSO
và các phương pháp tối ưu khác. Sau đây là một số kết quả được ghi nhận:
Trước hết ta phải kể đến sự kết hợp giữa các thuật toán tiến hóa (EA) và PSO.
Năm 1998, Angeline đã sử dụng thuật toán di truyền (GA) để chọn lọc và thay thế
những cá thể có vị trí hoặc vận tốc không tốt, từ đó tạo những lứa cá thể có cách ứng
xử tốt hơn. Kết quả cho thấy, sự hội tụ được tăng cường trong số 3 trong 4 trường hợp
kiểm tra. Tuy nhiên phương pháp này bị cho là xa rời ý nghĩa xã hội của thuật toán
PSO. Một hướng kết hợp giữa GA và PSO khác được nêu ra bởi Brits vào năm 2002.
Sự kết hợp này tạo thành dạng NichePSO. Trước tiên bằng thuật toán di truyền,
NichePSO sẽ tạo thành những nhóm cá thể dẫn đầu. Những lỗ trốn sẽ được tạo ra và
hình thành nên bán kính xung quanh nó. Trong quá trình tối ưu, các cá thể sẽ được
xem xét để gia nhập vào những nhóm cá thể dẫn đầu này. Kết quả cho thấy,
NichePSO có độ hội tụ rất tốt tuy nhiên quá trình hội tụ phụ thuộc rất nhiều vào cách
lựa chọn điểm khởi đầu cho các cá thể. Năm 2003, Zhang và Xie đã kết hợp DE với
PSO tạo thành thuật toán DEPSO. Với ý tưởng thực hiện cùng lúc cả PSO lẫn thuật
toán DE cho từng vòng lặp. Đầu tiên, thuật toán PSO sẽ được thực hiện trước để tìm
ra những cá thể tối ưu, sau đó quá trình đột biến sẽ được thực hiện nay trên những cá
thể tối ưu đó. Kết quả cho thấy DEPSO cho kết quả khá tốt trong một số trường hợp
đặc biệt là những bài toán nhiều chiều.
Bên cạnh sự kết hợp giữa với EA, còn PSO còn được kết hợp với thuật toán mờ
tạo thành Fuzzy Adaptive Turbulent PSO (FATPSO). Trong đó, thuật toán mờ được
áp dụng trong việc hiệu chỉnh thành phần vận tốc của các cá thể trong quá trình tìm
kiếm. Phương pháp này rất hiệu quả cho những bài toán có ít phần tử, khi số phần tử
càng tăng thì FATPSO không còn hiệu quả nữa.
Ngoài ra, PSO cũng kết hợp với nhiều thuật toán tối ưu khác như mạng neuron,
ant colony, … tuy nhiên nhìn chung những sự kết hợp này chỉ cho thấy hiệu quả trong
một số mặt nào đó chư chưa thật sự tạo bước đột phá cho quá trình cải tiến của thuật
toán PSO.
1.11. THUẬT TOÁN SWT-PSO:
Từ phương trình cập nhật vận tốc (3.1), ta thấy rằng hai trọng số ngẫu nhiên
cho các thành phần nhận thức và xã hội được tạo ra độc lập. Do đó, hai thông số ngẫu
nhiên này có thể được tạo ra hoặc quá lớn hoặc quá nhỏ cùng một lúc. Trong trường
hợp cả hai quá lớn, kinh nghiệm tự có và kinh nghiệm xã hội của các phần tử được sử
dụng nhiều hơn. Vì vậy các phần tử được điều khiển hướng ra xa giá trị tối ưu cục bộ.
Ngược lại, nếu cả hai giá trị ngẫu nhiên này quá nhỏ, tốc độ hội tụ giảm và kinh
nghiệm xã hội cũng không được sử dụng hoàn toàn. Điều này có thể dẫn đến vấn đề
hội tụ sớm, đặc biệt là với những hàm mục tiêu phi tuyến và có tính liên tục không
cao. Theo đó, phương pháp SWT_PSO được đề xuất ở đây để giải quyết những vấn đề
này bằng cách bảo quản sự cân bằng giữa thăm dò giá trị toàn cục và khai thác giá trị
cục bộ trong quá trình tìm kiếm.
A. Trade -off giữa các thành phần nhận thức và thành phần xã hội
Các trọng số ngẫu nhiên cho các thành phần nhận thức và xã hội nên được tạo
ra một cách có liên hệ []. Cụ thể hơn, nếu một thông số ngẫu nhiên là lớn thì thông số
kia là số nhỏ, hoặc ngược lại. Trong bài báo này, một trọng số ngẫu nhiên được sử
dụng, có xét đến kinh nghiệm của từng cá thể và những cá thể hàng xóm, khi cập nhật
vận tốc của các cá thể. Trọng số này được đại diện là r1 và 1 - r1 ().
B. Trade -off giữa động lượng vận tốc cũ , thành phần nhận thức và thành
phần xã hội :
Động lượng của vận tốc cũ ảnh hưởng đến khả năng tìm kiếm giá trị toàn cục
của thuật toán. Nếu động lượng quá lớn, các phần tử có thể vượt qua giá trị toàn cục
tốt nhất, dẫn đến khó khăn trong việc thay đổi hướng của chúng. Mặt khác, một động
lượng nhỏ sẽ cho phép hạt để thay đổi hướng một cách nhanh chóng. Điều này có
nghĩa là với động lượng nhỏ hơn, các thông số nhận thức và thông số xã hội ảnh
hưởng nhiều hơn đến việc điều khiển vị trí mới. Kết quả là, thành phần vận tốc cũ cần
được cân bằng với các thành phần nhận thứcvà thành phần xã hội bằng trị trung bình
của các trọng số ngẫu nhiên[13], được biểu diễn là r2 và 1 - r2 (10),tương ứng. Như
vậy, biểu thức cập nhật vận tốc () được sửa đổi thành:
C. Trade -off giữa hệ số tăng tốc :
Cơ chế cơ bản để xác định giải pháp tối ưu trong những phương pháp tối ưu
hóa dựa trên mô hình dân cư thường khuyến khích các cá thể khám phá không gian
tìm kiếm toàn bộ trong giai đoạn đầu của quá trình tìm kiếm để tìm ra khu vực hứa
hẹn. Khi quá trình tìm kiếm hướng về giai đoạn cuối, khả năng tìm kiếm giá trị cục bộ
sẽ thu hút các phần tử hướng đến giá trị toàn cục tốt nhất nhiều hơn. Để tăng cường
hiệu quả tìm kiếm của phương pháp PSO sửa đổi (), các hệ số gia tốc các thành phần
nhận thức và xã hội khác nhau trong các giai đoạn của quá trình tối ưu hóa [] như sau:
D. Tăng cường đa dạng của các phần tử:
Để tăng cường hơn nữa khả năng tìm kiếm giá trị toàn cục,tăng tính đa dạng
của thành viên bầy đàn đồng thời để tránh vấn đề hội tụ sớm. Trong thực tế, một số
phần tử nhất định có thể di chuyển theo hướng ngược lại của một khu vực khả thi do
những yếu kém của chúng. Vì vậy sự định hướng vận tốc hạt nên được đảo ngược vào
khu vực tối ưu []. Hành vi này dẫn đến hệ số "thờ ơ". Do đó, tốc độ cập nhật tiếp tục
sửa đổi để:
Trong đó: “sign” là hàm dấu được định nghĩa là:
Một số cá thể trong một cộng đồng xã hội có thể có hành vi khác với phần lớn
các cá thể khác trong nhóm. Hành vi này dẫn đến hệ số "kỳ dị" [13], [15]. Ảnh hưởng
của hệ số kỳ dị đến vận tốc của cá thể có thể được thể hiện như:
trong đó sign (r4) được định nghĩa là:
trong đó P (R4) được định nghĩa là:
Sự đa dạng ngày càng tăng của các phần tử thông qua hệ số thờ ơ và hệ số kỳ
dị giúp các phần tử thoát khỏi giá trị cực tiểu cục bộ do đó tránh nguy cơ xảy ra sớm
hội tụ.
Trong giai đoạn cuối cùng của quá trình tìm kiếm, khả năng tìm kiếm giá trị
cục bộ cần được khuyến khích để điều chỉnh chất lượng của một giải pháp ứng viên.
Vì vậy, ảnh hưởng của động lượng vận tốc cũ nên được giảm xuống để tránh các
phần tử bay vào các giá trị tối ưu toàn cục trước trong quá trình tìm kiếm. Trong (),
động lượng vận tốc cũ được kiểm soát bởi một hệ số trade-off ngẫu nhiên, đại diện bởi
r2sign (r3). Ở đây, chúng tôi đề xuất để giảm hiệu ứng ngẫu nhiên này một cách tuyến
tính thông qua tham số điều khiển (ξ (k)). Do đó, phương trình cập nhật tốc độ () được
sửa đổi:
Trong đó:
Động lượng của vận tốc cũ bây giờ được kiểm soát bởi một hệ số mới của ξ (k)
r2sign (r3). Thành phần này được gọi là"Hệ số kiểm soát trade-off động lượng ngẫu
nhiên". Hệ số sử dụng phương pháp giảm tuyến tính sẽ đi thăm dò giá trị toàn cục lâu
hơn phương pháp giảm phi tuyến. Kết quả này làm giảm nguy cơ bỏ lỡ vùng hứa hẹn.
Đặc tính thay đổi của các hệ số điều khiển ngẫu nhiên với số vòng lập của quá trình
tối ưu hóa được hiển thị trong Hình 1. Số vòng tối đa, max ξ, min ξ và Pltg được thiết
lập để 100, 1, 0,5 và 0,05, tương ứng.
Như đã thấy trong hình.1, dao động của Hệ số kiểm soát trade-off động lượng
ngẫu nhiên có thể nằm trong vùng đối lập. Điều này sẽ làm cho các phần tử đa dạng
nhiều hơn, dẫn đến tăng cường khả năng tìm kiếm toàn cầu này. Trong khi đó, dao
động cũng giảm một cách tuyến tính trong suốt quá trình tối ưu hóa. Do đó, Khả năng
tìm kiếm địa phương sẽ được tăng cường hơn trong khi giai đoạn cuối cùng của quá
trình tìm kiếm để điều chỉnh chất lượng của một giải pháp ứng viên.