Comprehensive Evaluation of Association Measures for Software Fault Localization

Comprehensive Evaluation of Association Measures for

Software Fault Localization

LUCIA, David LO, Lingxiao JIANG, Aditya BUDISingapore Management University

Introduction

Where is the fault ?

A Buggy Program

Automated Fault

Localization

Candidate of suspicious

program elements

Test Cases Failure

Fault Localization Techniques

Many fault localization techniques have been proposed.

One family of techniques: Spectrum-based fault localization (Reps et.al, 1997)

• Use program spectra (the representation of program behavior during execution)

An example of spectrum

Test Cases

Spectrum-based Fault Localization

• IdeaProgram element that frequently occurs in failed test case is likely to contain bug

• Example of existing measures :• Tarantula, Ochiai, etc.

Test Cases

– Tarantula (Jones and Harrold, 2005)

– Ochiai (Abreu et.al, 2007)

Our Contributions #1

Tarantula & Ochiai model fault localization as the association between

• The execution of program elements with occurrence of fault

We model fault localization as the association between

• The execution or non-execution of program elements with occurrence of fault

Modeling Fault Localization with Association MeasuresSuspiciousness score of a program element (e) is

defined using an association measure (M) as follows:

• A Non-control element M(EXECUTION(e), FAILURE)

• A Control elementMaximum of

M(EXECUTION(e), FAILURE) and M(NON-EXECUTION(children of e), FAILURE)

Our Contributions #2

• Evaluate the accuracies of 20 association measures for fault localization.

• Evaluate their relative performance as compared to Tarantula and Ochiai.

Existing Association Measures (Tan et.al, 2002, Geng and Hamilton, 2006, Cheng et.al.,2009)

Association M.1 Coefficient2 Odd Ratio3 Yule’s Q4 Yule ‘s Y5 Kappa6 J-Measure7 Gini Index8 Support9 Confidence10 Laplace

Association M.11 Conviction12 Interest13 Cosine14 Piatetsky-Shapiro15 Certainty Factor16 Added Value17 Collective Strength18 Jaccard19 Klosgen20 Information Gain

Modeling Fault Localization with Association Measures

Block 1 Execute !ExecuteFailed 1 0Passed 3 0

e.g. Cosine

A=Execute, B=FailedA=Execute, B=Failed

A=Not Execute B=Failed

Evaluation using Siemens Dataset

• dad

Dataset LOC #Faulty Versions

No. of Test

CasesPrint_tokens 472 5 4030Print_tokens2 399 10 4115Replace 512 31 5542Schedule 292 9 2650Schedule2 301 10 2710Tcas 141 36 1608Tot_Info 440 19 1052

Total : 120 buggy versions

Some measures are not as good as Ochiai and Tarantula.

Some measures are comparable Ochiai and Tarantula.

Improvement by Association Measure

Percentage of Inspected Elements

The Statistical Significance between Measures

Coefficient, Kappa, Confidence, Interest, Cosine, Added Value, Collective Strength , Jaccard, Klosgen,

Information Gain, Tarantula, Ochiai

Odd Ratio, Yule’s Q, Yule ‘s Y, Support, Laplace, Conviction

Certainty Factor

Piatetsky-Shapiro

Gini Index

J-Measure

Summary of Findings

– Fifty percent of the association measures have good accuracies for fault localization (28-34% inspected block)

– Association measures that are statistically comparable with Ochiai and Tarantula are: Coefficient, Kappa, Confidence, Interest, Cosine , Added Value, Collective Strength, Jaccard, Klosgen, Information Gain

– Information Gain can localize more bugs as compare to Ochiai when 20-50% blocks are

inspected.

Threats to Validity

• The effect of different granularity of instrumentation level (http://www.mysmu.edu/phdis2009/lucia.2009/Dataset.htm)

• Dataset for experimentation is not a large program

Future Work• Investigate large real program• Investigate the effectiveness of the measures

for different types of bug

THANK YOU

Comprehensive Evaluation of Association Measures for Software Fault Localization

Documents

Evaluating and improving fault localization - UMass …rjust/publ/fault_localization... · Evaluating and improving fault localization Spencer Pearson, José Campos , René Justy,

Constraint-Based Fault-Localization

Diversity Maximization Speedup for Fault Localization

An Online and Real-Time Fault Detection and Localization ... · An Online and Real-Time Fault Detection and Localization Mechanism 22:3 (4) Three different fault -localization granularities

Secure and Efficient Network Fault Localization

Evaluating&improving fault localization techniqueshomes.cs.washington.edu/~mernst/pubs/fault-localization... · 2019. 9. 13. · Evaluating&improving fault localization techniques

Fault Localization Using Bayesian Belief Network(BBN)_new

Delta Debugging and Model Checkers for fault localization

Combining Spectrum-Based Fault Localization and

Evaluating&improving fault localization techniquesrjust/publ/fault... · measure of the quality of the fault localization technique can be computed as follows [42], [47]: (1) run

Cross-Domain Fault Localizationeugeneng/inm08/presentations/Fischer.pdf · Department of Computer Science Naval Postgraduate School. 2 Network Fault Localization Fault localization:

Cooperative Localization using angular measures

1 Recent Advances in Fault Localization in Computer …adusia/papers/Fault...1 Recent Advances in Fault Localization in Computer Networks Ayush Dusia, Student Member, IEEE, and Adarshpal

Fault Localization Prioritization: Comparing …FLINT: Fault Localization using Information Theory A:3 according to their similarity to the test case that revealed the fault. We call

Comprehensive Evaluation of Association Measures for Software Fault Localization LUCIA, David LO, Lingxiao JIANG, Aditya BUDI Singapore Management University

Data Mining for Fault Localization: towards a Global

Automated Fitness Guided Fault Localization

Spectrum-basedMultiple Fault Localization

Localization of network service performance degradation in ... · of fault localization, but considerably less attention is given to the virtual network fault localization which should

Effective Fault Localization of Automotive Simulink Models