De Cuong Luan Van Anh Dang

CHƯƠNG 1 :

GIỚI THIỆU CHUNG

1.1. GIỚI THIỆU TỔNG QUÁT

Trên thế giới ngày nay nhu cầu năng lượng đang là vấn đề thời sự cho sự phát

triển của nền kinh tế và sự gia tăng dân số toàn cầu, trong đó năng lượng điện đóng

vai trò then chốt. Từ đó hệ thống điện cũng liên tục mở rộng, phát triển cả về nguồn

và các đường dây truyền tải. Do tính chất tiêu thụ điện ở các khu vực trong từng thời

điểm là khác nhau cho nên trào lưu công suất trên các đường dây truyền tải liên tục

thay đổi theo thời gian.

Kinh nghiệm vận hành hệ thống điện cho thấy tại một thời điểm trên hệ thống

có những đường dây bị quá tải trong khi các đường dây khác non tải và ngược lại. Nếu

có những biện pháp điều chỉnh thông số hệ thống điện thích hợp có thể làm thay đổi

trào lưu công suất và làm giảm quá tải cho một số đường dây mà không cần phải cải

tạo nâng cấp hệ thống điện. Việc sử dụng hiệu quả và tối ưu các nguồn cung cấp là

một vấn đề mà các nhà nghiên cứu rất quan tâm.

Vì vậy người ta đặt ra bài toán phân bố công suất tối ưu để nâng cao khả năng

tận dụng hệ thống điện hiện có. Đây là bài toán mà ngành điện lực phải tìm cách giải

quyết từ rất lâu, đã dùng nhiều thuật toán cổ điển và trí tuệ nhân tạo như Differential

Evolution , Ant Manners, Ant Colony Optimization, Genetic Algorithm, Tabu Search,

Simulated Annealing, Harmony Search, Firefly Algorithm … Trong sự phát triển của

trí tuệ nhân tạo, gần đây trong lĩnh vực công nghệ thông tin xuất hiện thuật toán PSO,

đây là thuật toán có nhiều ưu điểm và đã được ứng dụng rộng rãi vào trong rất nhiều

lĩnh vực, một trong những lĩnh vực ứng dụng của PSO là lĩnh vực hệ thống điện. Một

số nhà khoa học trên thế giới đã triển khai đưa thuật toán PSO vào ứng dụng tính toán

tối ưu trong hệ thống điện và đã cho ra những kết quả tốt hơn những giải thuật khác,

chương trình chạy nhanh hơn.

Phương pháp PSO là phương pháp dựa trên sự tối ưu bầy đàn thông qua việc đi

tìm vị trí có nhiều thức ăn nhất cho bầy đàn dựa trên kinh nghiệm của những lần tìm

kiếm trước. Mặt dù phương pháp PSO có tuổi đời còn rất trẻ mới chỉ được đề xuất lần

đầu tiên vào 1995 bởi James Kenedy và Russel C.Eberhart nhưng phương pháp PSO

đã có những đóng góp to lớn cho khoa học bởi tính hội tụ ưu việt của phương pháp

như: thuật toán đơn giản, dễ thực hiện, chương trình chạy nhanh hơn và kết quả chính

xác hơn các phương pháp khác.

1.2. MỤC TIÊU CỦA ĐỀ TÀI

Bài toán phân bố tối ưu công suất kháng (ORPD) đã có lịch sử phát triển từ rất

lâu nó có ý nghĩa vô cùng quan trọng trong quy hoạch và điều khiển hệ thống điện.

Mục đích của bài toán ORPD là để cải thiện biến dạng điện áp (Voltage Profile), cực

tiểu tổn thất công suất tác dụng trong hệ thống.

Hầu hết các phương pháp đều gặp phải 3 vấn đề chính: Một là, các phương

pháp này có thể không đưa ra được lời giải tối ưu hoặc thường bị kẹt ở lời giải tối ưu.

Hai là, tất cả các phương pháp này đều dựa trên giả định hàm mục tiêu là hàm liên tục

và khả vi mà không đúng đối với hệ thống thực tế. Ba là, các phương pháp này đều

không thể áp dụng cho các biến rời rạc.

Vì thế chỉ có thuật toán dựa trên trí thông minh nhân tạo và tiến hóa mà điển

hình là phương pháp PSO mới phù hợp với các loại bài toán này và loại trừ bỏ được

các vấn đề khó khăn trên.

1.3. TẦM QUAN TRỌNG CỦA ĐỀ TÀI

Hiện chưa có luận văn, công trình nghiên cứu trong nước về áp dụng thuật toán

Stochastic Weight Trade-off Particle Swarm Optimization (SWT_PSO) vào bài toán

phân bố tối ưu công suất kháng trong hệ thống điện. Điều này cho thấy tầm quan trọng

của nó trong việc tìm ra một lời giải tốt nhất, tối ưu nhất.

1.4. PHẠM VI NGHIÊN CỨU

1.5. NỘI DUNG LUẬN VĂN

CHƯƠNG 2:

TỔNG QUAN

1.6. TỔNG QUAN VỀ BÀI TOÁN TỐI ƯU HÓA CÔNG SUẤT PHẢN

KHÁNG

Bài toán tối ưu hóa công suất phản kháng có thể chia làm hai loại, tùy theo lĩnh

vực áp dụng:

Quy hoạch: Xác định dung lượng định mức và vị trí đặt tối ưu của thiết

bị bù Công suất phản kháng trong hệ thống điện.

Vận hành: Xác định giá trị đặt của các phần tử lien quan đến công suất

phản kháng như: Kích thích máy phát, máy biến áp có điều chỉnh dưới

tải, tụ bụ và các thiết bị FACTS.

Trong lĩnh vực vận hành, sau khi đã xác định công suất tác dụng đã phân phối

cho các nhà máy điện từ bài toán ED, bài toán tối ưu hóa công suất phản kháng được

sử dụng để cực tiểu tổn thất công suất tác dụng đồng thời đảm bảo điện áp tại các nút

trong hệ thống nằm trong phạm vi cho phép.

1.7. TỔNG QUAN CÁC PHƯƠNG PHÁP GIẢI ĐÃ ĐƯỢC ÁP DỤNG

2.2.1 Phương pháp DE (Differential Evolution)

Bài báo [] trình bày ứng dụng giải thuật DE vào việc giải bài toán phân bố

công suất tối ưu. DE là một thuật toán tiến hóa được đề xuất bởi Storn and Price vào

năm 1997. Phương pháp DE cho thấy hiệu quả trong việc giải quyết bài toán tối ưu

không tuyến tính với nhiều ràng buộc. DE có ưu điểm hơn các phương pháp tiến hóa

khác đó là cấu trúc đơn giản, gọn, ít thông số điều khiển, điểm hội tụ cao.Hàm mục

tiêu có dạng bậc hai dùng để tính toán là cực tiểu chi phí nhiên liệu máy phát với các

ràng buộc giới hạn công suất thực và công suất phản kháng máy phát, điện áp các nút,

đầu phân áp và dòng công suất trên các đường dây. Phương pháp đề xuất được ứng

dụng vào giải mạng điện IEEE 30 nút và kết quả được so sánh với các phương pháp:

EP, TS, SA.

2.2.2 Phương pháp AM (Ant Manners )

Bài báo [] trình bày phương pháp tính toán dựa trên hành vi của đàn kiến và

cách thu nhận tin tức của chúng. Phương pháp này được ứng dụng vào việc giải bài

toán phân bố công suất tối ưu để cực tiểu chi phí nhiên liệu máy phát với các ràng

buộc giới hạn công suất thực và công suất phản kháng máy phát, điện áp các nút, đầu

phân áp, tụ bù và dòng công suất trên các đường dây. Mô hình lựa chọn để tính toán là

mạng điện IEEE 30 nút và kết quả được so sánh với các phương pháp EP, GA.

2.2.3 Phương pháp ACO (Ant Colony Optimization)

Một trong những phương pháp tiến hóa dựa trên trí thông minh nhân tạo được

giới thiệu gần đây là phương pháp ACO được đề xuất bởi Marco Dorigo năm 1992.

ACO đưa ra cách tiếp cận mới mạnh mẽ và hiệu quả hơn cho những bài toán

tối ưu hóa phức tạp, thuật toán này tiêu biểu cho việc sử dụng mô hình xác suất để tìm

ra lời giải tối ưu. Phương pháp này dựa trên cách cử xử của đàn kiến đi tìm thức ăn.

Trong khi tìm thức ăn các cá thể kiến tự động khởi tạo xung quanh khu vực tổ của

chúng các thói quen riêng. Ngay khi có 1 cá thể kiến tìm được nguồn thức ăn, nó sẽ

đánh giá chất lượng và số lượng thức ăn đó và mang về tổ số thức ăn tìm được. Trong

suốt quá trình quay về tổ cá thể kiến này sẽ để lại trên lối về loại pheromone do nó tiết

ra. Lượng pheromone để lại có thể phụ thuộc vào chất lượng và số lượng thức ăn,

lượng pheromone này sẽ dẫn các cá thể kiến khác tới nguồn thức ăn này. Sự truyền

đạt không trực tiếp này giữa các cá thể kiến qua chất pheromone để lại trên lối mòn

cho phép chúng tìm được đường đi ngắn nhất giữa tổ của chúng và nguồn thức ăn đó.

Nói chung phương pháp ACO giải quyết bài toán tối ưu hóa bằng cách lặp lại 2

bước sau:

Lời giải ứng viên được xây dựng dựa trên mô hình chất đ pheromone

đặc trưng của loài kiến mà sự phân bố tần suất được thông số hóa qua

không gian bài toán.

Lời giải ứng viên được sử dụng để thay đổi các giá trị của chất đặc trưng

với cách mà được nghĩ rằng thiên về sự lấy mẫu hơn là về lời giải chất

lượng cao.

Phương pháp ACO được ứng dụng thành công trong nhiều bài toán khác nhau

như: bài toán người bán hàng du lịch, định tuyến xe cộ, mạng lưới viễn thông…

2.2.4 Phương pháp GA (Genetic Algorithm)

Bài báo [] trình bày việc giải bài toán phân bố công suất tối ưu trong mạng điện

lớn sử dụng phương pháp giải thuật gen. Thuật toán GA(Genetic Algorithm) được

phát minh bởi Holland vào đầu những năm 1970 là phương pháp tìm kiếm toàn cục

ngẫu nhiên mà dựa theo sự đánh giá di truyền tự nhiên GA hoạt động trên quần thể

của những lời giải ứng viên giải mã chuỗi hữu hạn gọi là nhiễm sắc thể(NST). Thông

thường các kết quả này được biểu diễn dưới dạng chuỗi số nhị phân hoặc các ký hiệu

mã hóa khác được gọi là nhiễm sắc thể. Để thu được sự tối ưu, mỗi NST phải trao đổi

thông tin bằng cách sử dụng những toán tử mượn từ gen tự nhiên để làm ra lời giải tối

ưu.Hàm mục tiêu dùng để tính toán là cực tiểu chi phí nhiên liệu máy phát với các

ràng buộc công suất máy phát, điện áp các nút, tụ bù, đầu phân áp nằm trong giới hạn

cho phép. Thời gian tính toán có thể giảm xuống bằng cách phân chia các ràng buộc

tối ưu thành ràng buộc tích cực để thao tác trực tiếp bằng giải thuật GA, duy trì các

ràng buộc thụ động trong giới hạn mềm sử dụng bài toán dòng công suất truyền thống.

Mạng IEEE 30 nút được ứng dụng để kiểm tra sự hiệu quả của giải thuật. Kết quả

được so sánh với các cách giải khác của giải thuật GA và phương pháp EP.

GA có nhiều ưu điểm trong tính toán, như đơn giản và tổng quát hóa. Ngoài ra,

nó còn tìm ra nhiều kết quả một cách đồng thời mà các phương pháp thông thường

không làm được. Vì thế, khả năng tìm ra kết quả tối ưu toàn cục được nâng lên. Ưu

điểm chính của GA là tìm ra kết quả gần tối ưu trong thời gian ngắn so với các

phương pháp dò tìm ngẫu nhiên khác như Simulated annealing (SA) hay Qui hoạch

động (DP) … Tuy nhiên, GA phụ thuộc nhiều vào hàm tương thích, nhạy với tỉ lệ lai

và đột biến, sơ đồ mã hóa các bit của nó, và độ dốc của đường cong không gian dò tìm

dẫn đến lời giải. GA đã được cải tiến và kiểm chứng trong bài toán điều độ kinh tế hệ

thống điện với nhiều dạng khác nhau cho thấy kết quả khá tốt.

2.2.5 Phương pháp TS (Tabu Search)

Phương pháp TS là phương pháp tìm kiếm để tìm giải pháp tối ưu dựa trên bộ

nhớ linh động của máy tính. Phương pháp ra đời năm 1986 bởi Fred W. Glover. Đầu

tiên TS chọn kết hợp tất cả các hàm chi phí của các tổ máy. Kết quả tính toán được mã

hóa ở dạng thập phân và được lưu vào bộ nhớ máy tính. Ưu đểm của TS là thời gian

tính toán nhỏ. Phương pháp này đã được chứng minh là giải quyết tốt bài toán điều độ

kinh tế với nhiều ràng buộc khác nhau.

Sự thuận lợi của thuật toán TS là việc nó sử dụng sự ghi nhớ uyển chuyển của

lịch sử tìm kiếm để ngăn ngừa dao động và tránh bị kẹt ở giá trị tối ưu cục bộ. TS có

thể giải quyết được các bài toán không lồi, không phẳng…

2.2.6 Phương pháp SA (Simulated Annealing)

SA(Simulated Annealing) là phương pháp được đề xuất bởi Kirt Patrick, Gelatt

và Vecchi năm 1983. SA đã được kiểm chứng trong một số bài toán tối ưu hóa và cho

kết quả rất tốt.

SA là phương pháp dựa trên việc tìm kiếm cục bộ mỗi bước di chuyển được

chấp nhận nếu cải thiện được năng lượng hệ thống. Một lời giải khác có thể chấp tùy

theo tiêu chí tần suất mà sự phân bố tần suất dựa trên quy trình luyện kim và chúng

được thu lại như hàm nhiệt độ của hệ thống.

Chiến thuật SA khởi đầu với nhiệt độ cao đưa ra tần suất phân bố cao để chấp

nhận với các bước di chuyển không được cải thiện. Nhiệt độ và mức độ phân bố giảm

bớt đáng kể như sự cải thiện của thuật toán về lời giải tối ưu.

2.2.7 Phương pháp HS (Harmony Search)

Thuật toán HS mô phỏng ngẫu hứng của người nhạc sĩ để tìm kiếm một sự hài

hòa, được đề xuất bởi Geem năm 2001. Thuật toán HS cải tiến để giải quyết bài toán

ED với nhiều ràng buộc cho thấy kết đầy quả hứa hẹn. Tuy nhiên thời gian tính toán

vẫn còn lâu.

2.2.8 Phương pháp FA (Firefly Algorithm)

Lấy cảm hứng từ hành nhấp nháy của đom đóm, FA được đề xuất bởi Xin-She

Yang vào năm 2008. Các kết quả thử nghiệm cho thấy tính hiệu quả của thuật toán FA

trong bài toán ED đa mục tiêu với nhiều ràng buộc phức tạp. FA phụ thuộc nhiều các

thông số lựa chọn. Đây là thuật toán mới, hứa hẹn vì thuật toán đơn giản và cho kết

quả nhanh hơn các thuật toán trước đó.

2.2.9 Phương pháp particle swarm optimization

Bài báo [] trình bày giải thuật PSO cho phân bố công suất phản kháng và điều

khiển ổn định điện áp. Đề xuất một phương pháp điều khiển biến liên tục và gián đoạn

như là giá trị hoạt động AVR, vị trí nấc OLTC và giá trị công suất phản kháng cần bù.

Trường hợp 1: xem xét ổn định điện áp sử dụng kỹ thuật dòng công suất liên

tục. Tính khả thi của phương pháp đề xuất được chứng minh trên mô hình hệ thống

điện với kết quả khả quan.[]

Trường hợp 2: xem xét vấn đề an ninh điện áp trong hệ thống điện sử dụng

phân bố công suất liên tục. Tính khả thi của phương pháp đề xuất được chứng minh

trên kỹ thuật phân tích ngẫu nhiên và so sánh với phương pháp tìm kiếm RTS

(Reactive Tabu Search) và phương pháp liệt kê trên mô hình hệ thống điện với kết quả

khả quan.[]

Trường hợp 3: phân bố công suất tối ưu có ràng buộc quá độ - ổn định điện áp

được xem như là dạng mở rộng của bài toán phân bố công suất tối ưu với thêm vào

ràng buộc bất đẳng thức góc của rotor. Trong trường hợp này, hàm mục tiêu được xem

xét là hàm cực tiểu chi phí nhiên liệu của hệ thống.[]

CHƯƠNG 3 :

GIỚI THIỆU VỀ PHƯƠNG PHÁP PSO

1.8. GIỚI THIỆU

Thuật toán PSO (Particle Swarm Optimization) - tối ưu bầy đàn (tạm dịch)

là một trong những thuật toán xây dựng dựa trên khái niệm trí tuệ bầy đàn để tìm kiếm

lời giải cho các bài toán tối ưu hóa trên một không gian tìm kiếm nào đó. PSO là một

dạng của các thuật toán tiến hóa quần thể đã được biết đến trước đây như giải thuật di

truyền (GA) , Thuật toán đàn kiến (ACO) . Tuy vậy PSO khác với GA ở chỗ nó thiên

về sử dụng sự tương tác giữa các cá thể trong một quần thể để khám phá không gian

tìm kiếm. PSO là kết quả của sự mô hình hóa việc đàn chim bay đi tìm kiếm thức ăn

cho nên nó thường được xếp vào loại thuật toán có sử dụng trí tuệ bầy đàn. PSO được

giới thiệu vào năm 1995 tại một hội nghị của IEEE bởi James Kennedy và Russell C.

Eberhart . Thuật toán có nhiều ứng dụng quan trọng trong tất cả các lĩnh vực mà ở đó

đòi hỏi phải giải quyết các bài toán tối ưu hóa.

Để hiểu rõ thuật toán PSO ta hãy xem một ví dụ đơn giản về quá trình tìm kiếm

thức ăn của một đàn chim. Không gian tìm kiếm thức ăn lúc này là toàn bộ không gian

ba chiều mà chúng ta đang sinh sống. Tại thời điểm bắt đầu tìm kiếm cả đàn bay theo

một hướng nào đó, có thể là rất ngẫu nhiên. Tuy nhiên sau một thời gian tìm kiếm một

số cá thể trong đàn bắt đầu tìm ra được nơi có chứa thức ăn. Tùy theo số lượng thức

ăn vừa tìm kiếm, mà cá thể gửi tín hiệu đến các cá thể khác đang tìm kiếm ở vùng lân

cận, tín hiệu này nhanh chóng lan truyền trên toàn quần thể. Dựa vào thông tin nhận

được mỗi cá thể sẽ điều chỉnh hướng bay và vận tốc theo hướng về nơi có nhiều thức

ăn nhất. Cơ chế truyền tin như vậy thường được xem như là một kiểu hình của trí tuệ

bầy đàn. Cơ chế này giúp cả đàn chim tìm ra nơi có nhiều thức ăn nhất trên không

gian tìm kiếm vô cùng rộng lớn. Như vậy đàn chim đã dùng trí tuệ, kiến thức và kinh

nghiệm của cả đàn để nhanh chóng tìm ra nơi chứa thức ăn. Bây giờ chúng ta tìm hiểu

làm cách nào mà một mô hình trong sinh học như vậy có thể áp dụng trong tính toán

và sinh ra thuật toán PSO mà chúng ta từng nhắc đến. Việc mô hình hóa này thường

được gọi là quá trình phỏng sinh học (bioinspired) mà chúng ta thường thấy trong

các ngành khoa học khác. Một thuật toán được xây dựng dựa trên việc mô hình hóa

các quá trình trong sinh học được gọi là thuật toán phỏng sinh học (bioinspired

algorithms).

Hãy xét bài toán tối ưu của hàm số F trong không gian n chiều. Mỗi vị trí trong

không gian là một điểm tọa độ n chiều. Hàm F là hàm mục tiêu xác định trong không

gian n chiều và nhận giá trị thực. Mục đích là tìm ra điểm cực tiểu của hàm F trong

miền xác định nào đó. Ta bắt đầu xem xét sự liên hệ giữa bài toán tìm thức ăn với bài

toán tìm cực tiểu của hàm theo cách như sau. Giả sử rằng số lượng thức ăn tại một vị

trí tỉ lệ nghịch với giá trị của hàm F tại vị trí đó. Có nghĩa là ở một vị trí mà giá trị

hàm F càng nhỏ thì số lượng thức ăn càng lớn. Việc tìm vùng chứa thức ăn nhiều nhất

tương tự như việc tìm ra vùng chứa điểm cực tiểu của hàm F trên không gian tìm

kiếm.

1.9. BIỂU THỨC CƠ BẢN CỦA THUẬT TOÁN PSO

Phương pháp Particle Swarm Optimization (PSO) là kỹ thuật tối ưu hóa được

phái triển bởi Kennedy và Eberhart vào năm 1995. Động cơ thúc đẩy sự phát triển

của phương pháp này dựa trên sự mô phỏng xã hội của các động vật cấp thấp như cá,

chim, v.v.

Giống như những phương pháp tối ưu dựa trên mô hình dân cư khác như GA,

PSO bắt đầu bằng một trường hợp ngẫu nhiên của các cá thể của cộng đồng dân cư

trong không gian tìm kiếm. Tuy nhiên, không giống với các phương pháp tiến hóa

khác, trong PSO không có sự kết nối giữa các phần tử di truyền trong quá trình tìm

kiếm, thuật toán PSO làm việc dựa trên ứng xử xã hội của các phần tử trong nhóm. Vì

vậy, kết quả tối ưu toàn cục do sự hiệu chỉnh quỹ đạo của các cá thể sẽ dẫn đến vị trí

tốt nhất và phần tử tối ưu nhất trong nhóm sau mỗi lần bước tính. Phương pháp PSO

đang trở nên phổ biến vì tính đơn giản và khả năng hội tụ nhanh chóng đạt kết quả tốt.

Trong thuật toán particle swarm (tạm dịch là bầy nhóm), quỹ đạo của mỗi cá

thể trong không gian tìm kiếm được hiệu chỉnh bằng cách thay đổi vận tốc của từng cá

thể, thông qua kinh nghiệm bay của nó và kinh nghiệm bay của những cá thể khác

trong không gian tìm kiếm. Vector vị trí và vector vận tốc của một cá thể thứ i trong

không gian d chiều là:

Thông qua cách đặt hàm định nghĩa, chúng ta sẽ tìm ra được giá trị phù hợp

nhất đạt được bởi một phần tử tại thời điểm t là: và cá thể phù

hợp nhất tại thời điểm t là . Sau đó, vận tốc mới và vị trí mới

của các cá thể được tính toán bằng 2 biểu thức sau:

(3.1)

(3.2)

Trong đó

c1, c2 là những hằng số gia tốc.

rand(.) và Rand (.) là dạng tạo số ngẫu nhiên trong đoạn [0,1] (2 hàm này có

mối liên hệ đồng dạng với nhau).

Phần đầu tiên trong công thức (3.1) đại diện cho vận tốc trước đó, để tạo đà cho

cá thể tiếp tục đi lang trong không gian tìm kiếm. Thành phần thứ 2, được xem là

thành phần “cognitive”, đại diện cho suy tính nhân tạo của các cá thể, chính thành

phần này sẽ hướng các cá thể đến vi trí tốt nhất của nó. Thành phần thứ 3 được xem là

thành phần “xã hội”, nó đại diện cho hiệu ứng “colaborative” của các cá thể trong quá

trình tìm kiếm lời giải tối ưu toàn cục. chính thành phần xã hội sẽ lôi kéo các cá thể

hướng đến giá trị tối ưu toàn cục.

Ban đầu các cá thể sẽ được tạo ra với 1 vị trí ngẫu nhiên, sau đó các vận tốc

ngẫu nhiên được ấn định cho từng cá thể. Sự phù hợp của các cá thể được ước lượng

thông qua hàm mục tiêu. Ở mỗi thời kỳ, vận tốc của từng cá thể được tính toán thông

qua (1) và vị trí trong lần ước lượng tới được cập nhật bằng (3.2). Sau mỗi khoảng

thời gian nếu các cá thể tìm ra vị trí tối ưu hơn vị trí trước thì vị trí của nó được lưu

vào bộ nhớ. Một cách khái quát, vận tốc lớn nhất ( ) cho mỗi module của vector

vận tốc của các cá thể được định nghĩa để điều khiển phạm vi của các cá thể trong

không gian tìm kiến cho người dùng tự định nghĩa.

1.10. MỘT SỐ CẢI TIẾN QUAN TRỌNG TRONG QUÁ TRÌNH PHÁT

TRIỂN CỦA PSO

3.3.1. Dạng Constriction PSO

Vào nằm 2002, Clerc và Kennedy đã chứng tỏ rằng một hệ số co có thể giúp

tăng cường tốc độ hội tụ. Hệ số co đó được tạo thành bằng sự kết hợp giữa các giá trị

c1 và c2. Khi đó, dạng constriction PSO có biểu thức như sau:

(3.3)

Trong đó: được gọi bằng hệ số co, được xác định bởi biểu thức:

với (3.4)

Thông thường giá trị c1 và c2 được chọn bằng nhau và bằng 2.05 và khi đó

=0.7298. Dạng constriction PSO đã được áp dụng cho nhiều lĩnh vực khác nhau và

trở thành một trong những dạng PSO được sử dụng rộng rãi nhất. Về sau, Eberhart và

Shi đã đặt lại trọng số quán tính thay vì sử dụng hệ số co , mở đường cho sự ra đời

phương pháp PSO – TVIW.

3.3.2. PSO – TVIW

Shi và Eberhart đã giới thiệu ý tưởng về trọng số quán tính thêm vào phiên bản

chuẩn của PSO nhằm cân bằng kết quả cục bộ và toàn cục trong quá trình tìm kiếm.

Biểu thức toán của ý tưởng này được thể hiện như sau:

(3.5)

Trong đó được cho bởi công thức: (3.6)

Với 1 và 2 là giá trị đầu và giá trị cuối của trọng số quán tính. “iter” là vòng

lặp hiện tại và “MAXITER” là giá trị lớn nhất của vòng lặp có thể chấp nhận được.

Phương pháp này được gọi là PSO – TVIW. Kết quả nghiên cứu cho thấy PSO –

TVIW tỏ ra không hiệu quả cho các bài toán có dạng “tracking dynamic systems”.

Thay vào đó, đối với các ứng dụng dynamic trong tự nhiên, họ đã đề xuất một trọng số

quán tính ngẫu nhiên cho tracking dynamic system.

(3.7)

Phương pháp này được gọi là PSO – RANDIW.

Cả 2 phương pháp trên đều pháp triển PSO theo hướng TVIW. Tuy PSO –

TVIW có thể cho kết quả tối ưu tốt nhưng khi so sánh với với các thuật toán tiến hóa

khác, thì khả năng tìm kiếm đáp án đúng của nó lại khá thấp.

3.3.3. Kỹ thuật TVAC

Như đã phân tích ở trên, phương pháp PSO tìm kiếm giải pháp tối ưu được dựa

trên 2 thành phần gia tốc. Vì vậy, sự điều khiển thích hợp của 2 thành phần đó rất

quan trọng để tìm ra giải pháp tối ưu một cách chính xác và hiệu quả.

Kennedy và Eberhart đã mô tả rằng một giá trị tương đối cao của thành phần

cognitive, so với thành phần social, sẽ tạo ra kết quả lạc lối của các cá thể trong không

gian tìm kiếm. Ngược lại, với giá trị tương đối cao của thành phần social sẽ dẫn các cá

thể đến lời giải cục bộ. Do đó, họ đã đề nghị cách thiết lập cả 2 thành phần gia tốc như

biểu thức (3.2), khi đó giá trị trung bình của 2 thành phần sẽ thống nhất với nhau, vì

vậy các cá thể chỉ cần bay một nửa thời gian tìm kiếm. Kể từ đó, đề xuất này được sử

dụng cho hầu hết các nghiên cứu.

Suganthan đã kiểm tra một phương pháp giảm tuyến tính của cả 2 hệ số gia tốc

theo giời gian, nhưng kết quả cho thấy hệ số gia tốc được cho bởi biểu thức (3.2) vẫn

cho giá trị tốt hơn. Tuy nhiên, thông qua nghiên của mình ông ấy đã cho thấy rằng hệ

số gia tốc không nhất thiết phải lúc nào cũng bằng biểu thức (3.2).

Một cách khái quát, trong các thuật toán tối ưu dựa vào cộng đồng, ta mong

muốn khuyến khích các cá thể đi khắp nơi trong không gian tìm kiếm mà không tụm

lại tại quanh những giá trị tối ưu cục bộ trong giai đoạn đầu của quá trình tối ưu. Bên

cạnh đó, trong những giai đoạn sau, điều quan trọng là phải tăng cường sự hội tụ về

giá trị tối ưu toàn cục nhằm kiếm lời giải một cách có hiệu quả.

Một kỹ thuật tăng cường cho PSO được giới thiệu là TVAC (time-varying

acceleration coefficients). Mục tiêu của sự cải tiến này là nhằm tăng cường tìm kiếm

lời giải toàn cục trong giai đoạn đầu của quá trình tối ưu và khuyến khích các cá thể

hội tụ về giá trị tối ưu toàn cục trong giai đoạn cuối của quá trình tìm kiếm.

Với kỹ thuật TVAC này, giá trị của thành phần cognitive sẽ giảm trong khi

thành phần social được tăng lên, bằng cách thay đổi hệ số c1 và c2 theo thời gian. Bằng

cách khởi đầu bằng thành phần cognitive có giá trị lớn và thành phần social có giá trị

nhỏ, các cá thể sẽ được phép di chuyển khắp nơi trong không gian tìm kiếm, thay vì đi

thẳng đến điểm tối ưu. Bên cạnh đó, với giá trị nhỏ của thành phần cognitive và giá trị

lớn của thành phần social cho phép các cá thể hướng đến giá trị tối ưu toàn cục trong

giai đoạn sau của quá trình tối ưu. Ngoài ra, hệ số TVIW cũng được sử dụng theo biểu

thức (3.4). Như vậy biểu toán của thuật toán PSO – TVAC như sau:

(3.8)

(3.9)

Trong đó:

c1i, c1f, c2i, c2f là những hằng số.

iter là vòng lặp hiện tại.

MAXITR là số vòng lặp cực đại cho phép.

Bằng thực nghiệm, giá trị c1 thay đổi từ 2.5 đến 0.5 và giá trị c2 thay đổi từ 0.5

đến 2.5 là cho kết quả tối ưu tốt hơn cả.

3.3.4. MPSO – TVAC

Trong PSO, sự thiếu phong phú của cộng đồng, đặc biệt trong giai đoạn cuối

của quá trình tối ưu, được hiểu như là sự vội vã khi đánh giá hệ số vượt trội của kết

quả hội tụ so với các giá trị tối ưu cục bộ. Gần đây, một vài cố gắng nhằm tăng tính

phong phú của cộng đồng đã được báo cáo, thông qua cách ứng xử của các cá thể

trong bầy đàn khi tìm kiếm. Xa hơn nữa, có thể sử dụng sự đột biến trong PSO (giống

như trong thuật toán di truyền) như là một kỹ thuật tăng cường. Sau đây là thuật toán

MPSO tăng cường khả năng tìm kiếm toàn cục bằng cách tăng tính phong phú.

Trong PSO, sự tìm kiếm hướng đến giải pháp tối ưu toàn cục được cho bởi 2 hệ

số gia tốc. Vì vậy, Angeline đã liên kết 2 hệ số gia tốc đó với hàm đột biến trong thuật

toán tiến hóa, trong khi đó, Shi và Eberthard liên kết 2 hệ số đó với hành vi lai giống

trong thuật toán di truyền.

Kết quả số mô phỏng cho thấy PSO tìm kiếm giải pháp cục bộ tốt hơn nhưng

đôi khi vẫn còn một kết quả tối ưu cục bộ có số vòng lặp lớn không được tìm ra. Vì

vậy để điều khiển trường hợp này, chúng ta tăng cường quá trình tìm kiếm toàn cục

bằng cách thực hiện sự đột biến, tương tự như sự đột biến trong thuật toán di truyền.

Với chiến lược mới này, khi giải pháp tối ưu toàn cục không cải tiến do số lần lặp tăng

lên, một cá thể sẽ được lựa chọn ngẫu nhiên sau đó một giá trị “lộn xộn” (kích thước

đột biến) được cộng thêm vào module vận tốc được lựa chọn ngẫu nhiên theo một quy

luật xác suất được định trước. Pseudocode cho thuật toán MPSO như sau:

Trong đó:

randi(.) độc lập với nhau, tạo ra các giá trị ngẫu nhiên đồng dạng trong

khoảng [0,1].

Pm là xác suất đột biến

global là mức cải tiến của giải pháp toàn cục.

m, k, l là những hằng số.

3.3.5. SOHPSO – TVAC

Theo những nghiên cứu trước, sự phát triển của PSO đều dựa trên trọng số

quán tính, với một hệ số quán tính được điều chỉnh tuyến tính hoặc một hệ số co nào

đó. Tuy nhiên, Shi và Eberthart đã đề nghị một hàm phức tạp đa phương thức, sự điều

chỉnh tính phong phú của cộng đồng bằng một hệ số quán tính tuyến tính có thể dẫn

các cá thể hội tụ đến một giá trị tối ưu cục bộ. Mặt khác, quá trình nghiên cứu của

Eberthard và Shi cho thấy phương pháp hệ số co không ảnh hưởng đến hàm phức tạp

đa phương thức.

Ngược lại, Kennedy và Eberthard đã đề nghị một phiên bản PSO mà không có

vận tốc của vòng lặp trước (biểu thức 3.1). Sau đó, họ kết luận rằng phiên bản PSO

này rất đơn giản, nó không ảnh hưởng nhiều trong quá trình tìm kiếm giải pháp tối ưu

toàn cục cho hầu hết các vấn đề phức tạp.

Chúng ta quan sát cách ứng xử của các cá thể trong cộng đồng mà không có

biểu thức hồi quy vận tốc (3.1). Khi không có biểu thức (3.1) các cá thể nhanh chóng

đổ xô về giá trị tối ưu cục bộ và động ứ lại do thiếu đà. Thật vậy, khi không có biểu

thức vận tốc, giải pháp tối ưu phục thuộc nhiều vào giá trị đầu vào của cộng đồng.

Phương pháp SOHPSO sẽ cung cấp động lượng cần thiết cho các cá thể tìm ra

giải pháp tối ưu toàn cục mà không cần đến biểu thức vận tốc.

Với phương pháp này, ta giữ thành phần ban đầu bằng 0 và khởi động lại

module vận tốc của cá thể với một giá trị vận tốc ngẫu nhiên trong không gian tìm

kiếm. Vì vậy, với phương pháp này, một chuỗi các giá trị tối ưu sẽ được tự động tạo ra

thông qua cách ứng xử của cá thể trong không gian, cho đến khi tiêu chuẩn hội tụ đạt

được.

Trong đó randi(.) là những hàm ngẫu nhiên độc lập nhau và v là vecto vận tốc

khởi động lại.

3.3.6. Sự kết hợp giữa phương pháp PSO và các phương pháp tối ưu khác

Bên cạnh những cải tiến về mặt bản chất của phương pháp PSO, một hướng

tiếp cận khác nhằm nâng cao hiệu quả của phương pháp này là sự kết hợp giữa PSO

và các phương pháp tối ưu khác. Sau đây là một số kết quả được ghi nhận:

Trước hết ta phải kể đến sự kết hợp giữa các thuật toán tiến hóa (EA) và PSO.

Năm 1998, Angeline đã sử dụng thuật toán di truyền (GA) để chọn lọc và thay thế

những cá thể có vị trí hoặc vận tốc không tốt, từ đó tạo những lứa cá thể có cách ứng

xử tốt hơn. Kết quả cho thấy, sự hội tụ được tăng cường trong số 3 trong 4 trường hợp

kiểm tra. Tuy nhiên phương pháp này bị cho là xa rời ý nghĩa xã hội của thuật toán

PSO. Một hướng kết hợp giữa GA và PSO khác được nêu ra bởi Brits vào năm 2002.

Sự kết hợp này tạo thành dạng NichePSO. Trước tiên bằng thuật toán di truyền,

NichePSO sẽ tạo thành những nhóm cá thể dẫn đầu. Những lỗ trốn sẽ được tạo ra và

hình thành nên bán kính xung quanh nó. Trong quá trình tối ưu, các cá thể sẽ được

xem xét để gia nhập vào những nhóm cá thể dẫn đầu này. Kết quả cho thấy,

NichePSO có độ hội tụ rất tốt tuy nhiên quá trình hội tụ phụ thuộc rất nhiều vào cách

lựa chọn điểm khởi đầu cho các cá thể. Năm 2003, Zhang và Xie đã kết hợp DE với

PSO tạo thành thuật toán DEPSO. Với ý tưởng thực hiện cùng lúc cả PSO lẫn thuật

toán DE cho từng vòng lặp. Đầu tiên, thuật toán PSO sẽ được thực hiện trước để tìm

ra những cá thể tối ưu, sau đó quá trình đột biến sẽ được thực hiện nay trên những cá

thể tối ưu đó. Kết quả cho thấy DEPSO cho kết quả khá tốt trong một số trường hợp

đặc biệt là những bài toán nhiều chiều.

Bên cạnh sự kết hợp giữa với EA, còn PSO còn được kết hợp với thuật toán mờ

tạo thành Fuzzy Adaptive Turbulent PSO (FATPSO). Trong đó, thuật toán mờ được

áp dụng trong việc hiệu chỉnh thành phần vận tốc của các cá thể trong quá trình tìm

kiếm. Phương pháp này rất hiệu quả cho những bài toán có ít phần tử, khi số phần tử

càng tăng thì FATPSO không còn hiệu quả nữa.

Ngoài ra, PSO cũng kết hợp với nhiều thuật toán tối ưu khác như mạng neuron,

ant colony, … tuy nhiên nhìn chung những sự kết hợp này chỉ cho thấy hiệu quả trong

một số mặt nào đó chư chưa thật sự tạo bước đột phá cho quá trình cải tiến của thuật

toán PSO.

1.11. THUẬT TOÁN SWT-PSO:

Từ phương trình cập nhật vận tốc (3.1), ta thấy rằng hai trọng số ngẫu nhiên

cho các thành phần nhận thức và xã hội được tạo ra độc lập. Do đó, hai thông số ngẫu

nhiên này có thể được tạo ra hoặc quá lớn hoặc quá nhỏ cùng một lúc. Trong trường

hợp cả hai quá lớn, kinh nghiệm tự có và kinh nghiệm xã hội của các phần tử được sử

dụng nhiều hơn. Vì vậy các phần tử được điều khiển hướng ra xa giá trị tối ưu cục bộ.

Ngược lại, nếu cả hai giá trị ngẫu nhiên này quá nhỏ, tốc độ hội tụ giảm và kinh

nghiệm xã hội cũng không được sử dụng hoàn toàn. Điều này có thể dẫn đến vấn đề

hội tụ sớm, đặc biệt là với những hàm mục tiêu phi tuyến và có tính liên tục không

cao. Theo đó, phương pháp SWT_PSO được đề xuất ở đây để giải quyết những vấn đề

này bằng cách bảo quản sự cân bằng giữa thăm dò giá trị toàn cục và khai thác giá trị

cục bộ trong quá trình tìm kiếm.

A. Trade -off giữa các thành phần nhận thức và thành phần xã hội

Các trọng số ngẫu nhiên cho các thành phần nhận thức và xã hội nên được tạo

ra một cách có liên hệ []. Cụ thể hơn, nếu một thông số ngẫu nhiên là lớn thì thông số

kia là số nhỏ, hoặc ngược lại. Trong bài báo này, một trọng số ngẫu nhiên được sử

dụng, có xét đến kinh nghiệm của từng cá thể và những cá thể hàng xóm, khi cập nhật

vận tốc của các cá thể. Trọng số này được đại diện là r1 và 1 - r1 ().

B. Trade -off giữa động lượng vận tốc cũ , thành phần nhận thức và thành

phần xã hội :

Động lượng của vận tốc cũ ảnh hưởng đến khả năng tìm kiếm giá trị toàn cục

của thuật toán. Nếu động lượng quá lớn, các phần tử có thể vượt qua giá trị toàn cục

tốt nhất, dẫn đến khó khăn trong việc thay đổi hướng của chúng. Mặt khác, một động

lượng nhỏ sẽ cho phép hạt để thay đổi hướng một cách nhanh chóng. Điều này có

nghĩa là với động lượng nhỏ hơn, các thông số nhận thức và thông số xã hội ảnh

hưởng nhiều hơn đến việc điều khiển vị trí mới. Kết quả là, thành phần vận tốc cũ cần

được cân bằng với các thành phần nhận thứcvà thành phần xã hội bằng trị trung bình

của các trọng số ngẫu nhiên[13], được biểu diễn là r2 và 1 - r2 (10),tương ứng. Như

vậy, biểu thức cập nhật vận tốc () được sửa đổi thành:

C. Trade -off giữa hệ số tăng tốc :

Cơ chế cơ bản để xác định giải pháp tối ưu trong những phương pháp tối ưu

hóa dựa trên mô hình dân cư thường khuyến khích các cá thể khám phá không gian

tìm kiếm toàn bộ trong giai đoạn đầu của quá trình tìm kiếm để tìm ra khu vực hứa

hẹn. Khi quá trình tìm kiếm hướng về giai đoạn cuối, khả năng tìm kiếm giá trị cục bộ

sẽ thu hút các phần tử hướng đến giá trị toàn cục tốt nhất nhiều hơn. Để tăng cường

hiệu quả tìm kiếm của phương pháp PSO sửa đổi (), các hệ số gia tốc các thành phần

nhận thức và xã hội khác nhau trong các giai đoạn của quá trình tối ưu hóa [] như sau:

D. Tăng cường đa dạng của các phần tử:

Để tăng cường hơn nữa khả năng tìm kiếm giá trị toàn cục,tăng tính đa dạng

của thành viên bầy đàn đồng thời để tránh vấn đề hội tụ sớm. Trong thực tế, một số

phần tử nhất định có thể di chuyển theo hướng ngược lại của một khu vực khả thi do

những yếu kém của chúng. Vì vậy sự định hướng vận tốc hạt nên được đảo ngược vào

khu vực tối ưu []. Hành vi này dẫn đến hệ số "thờ ơ". Do đó, tốc độ cập nhật tiếp tục

sửa đổi để:

Trong đó: “sign” là hàm dấu được định nghĩa là:

Một số cá thể trong một cộng đồng xã hội có thể có hành vi khác với phần lớn

các cá thể khác trong nhóm. Hành vi này dẫn đến hệ số "kỳ dị" [13], [15]. Ảnh hưởng

của hệ số kỳ dị đến vận tốc của cá thể có thể được thể hiện như:

trong đó sign (r4) được định nghĩa là:

trong đó P (R4) được định nghĩa là:

Sự đa dạng ngày càng tăng của các phần tử thông qua hệ số thờ ơ và hệ số kỳ

dị giúp các phần tử thoát khỏi giá trị cực tiểu cục bộ do đó tránh nguy cơ xảy ra sớm

hội tụ.

Trong giai đoạn cuối cùng của quá trình tìm kiếm, khả năng tìm kiếm giá trị

cục bộ cần được khuyến khích để điều chỉnh chất lượng của một giải pháp ứng viên.

Vì vậy, ảnh hưởng của động lượng vận tốc cũ nên được giảm xuống để tránh các

phần tử bay vào các giá trị tối ưu toàn cục trước trong quá trình tìm kiếm. Trong (),

động lượng vận tốc cũ được kiểm soát bởi một hệ số trade-off ngẫu nhiên, đại diện bởi

r2sign (r3). Ở đây, chúng tôi đề xuất để giảm hiệu ứng ngẫu nhiên này một cách tuyến

tính thông qua tham số điều khiển (ξ (k)). Do đó, phương trình cập nhật tốc độ () được

sửa đổi:

Trong đó:

Động lượng của vận tốc cũ bây giờ được kiểm soát bởi một hệ số mới của ξ (k)

r2sign (r3). Thành phần này được gọi là"Hệ số kiểm soát trade-off động lượng ngẫu

nhiên". Hệ số sử dụng phương pháp giảm tuyến tính sẽ đi thăm dò giá trị toàn cục lâu

hơn phương pháp giảm phi tuyến. Kết quả này làm giảm nguy cơ bỏ lỡ vùng hứa hẹn.

Đặc tính thay đổi của các hệ số điều khiển ngẫu nhiên với số vòng lập của quá trình

tối ưu hóa được hiển thị trong Hình 1. Số vòng tối đa, max ξ, min ξ và Pltg được thiết

lập để 100, 1, 0,5 và 0,05, tương ứng.

Như đã thấy trong hình.1, dao động của Hệ số kiểm soát trade-off động lượng

ngẫu nhiên có thể nằm trong vùng đối lập. Điều này sẽ làm cho các phần tử đa dạng

nhiều hơn, dẫn đến tăng cường khả năng tìm kiếm toàn cầu này. Trong khi đó, dao

động cũng giảm một cách tuyến tính trong suốt quá trình tối ưu hóa. Do đó, Khả năng

tìm kiếm địa phương sẽ được tăng cường hơn trong khi giai đoạn cuối cùng của quá

trình tìm kiếm để điều chỉnh chất lượng của một giải pháp ứng viên.

Documents

De Cuong Luan Van Anh Dang