Confusion Matrix

Karışıklık matrisi, bir sınıflandırma modelinin performansını değerlendirmek için kullanılan bir araçtır. Genellikle 2×2 boyutunda bir matris şeklinde gösterilir. Matrisin satırları gerçek sınıfları, sütunları ise modelin tahmin ettiği sınıfları temsil eder.

  1. Gerçek Pozitifler (True Positives – TP): Modelin doğru bir şekilde pozitif olarak sınıflandırdığı örneklerin sayısını ifade eder. Yani, gerçekten pozitif olan ve modelin de pozitif olarak sınıflandırdığı örneklerdir.
  2. Gerçek Negatifler (True Negatives – TN): Modelin doğru bir şekilde negatif olarak sınıflandırdığı örneklerin sayısını ifade eder. Yani, gerçekten negatif olan ve modelin de negatif olarak sınıflandırdığı örneklerdir.
  3. Yanlış Pozitifler (False Positives – FP): Modelin yanlış bir şekilde pozitif olarak sınıflandırdığı örneklerin sayısını ifade eder. Yani, gerçekte negatif olan ancak modelin pozitif olarak sınıflandırdığı örneklerdir.
  4. Yanlış Negatifler (False Negatives – FN): Modelin yanlış bir şekilde negatif olarak sınıflandırdığı örneklerin sayısını ifade eder. Yani, gerçekte pozitif olan ancak modelin negatif olarak sınıflandırdığı örneklerdir.

Karışıklık matrisi, bu dört değeri kullanarak modelin performansını daha ayrıntılı bir şekilde analiz etmemizi sağlar. Özellikle, hassasiyet (precision), duyarlılık (recall) ve F1 skoru gibi performans metriklerinin hesaplanmasında kullanılır. Hassasiyet, modelin pozitif olarak tahmin ettiği örneklerin gerçekten kaçının pozitif olduğunu ölçerken, duyarlılık, gerçek pozitiflerin kaçının model tarafından tespit edildiğini gösterir. F1 skoru ise hassasiyet ve duyarlılığın harmonik ortalamasıdır, bu nedenle dengeli bir performans ölçüsü olarak kabul edilir.

Hassasiyet (Precision): Hassasiyet, pozitif olarak tahmin edilen örneklerin gerçekte ne kadarının pozitif olduğunu ölçer. Yani, modelin pozitif olarak sınıflandırdığı örneklerin ne kadarının gerçekten pozitif olduğunu belirler. Örneğin, bir hastalığı teşhis eden bir modelde, hassasiyet, modelin pozitif olarak teşhis ettiği hastaların gerçekten hastalıklı olanların oranını ifade eder. Hassasiyetin formülü şu şekildedir:

Hassasiyet=TP/(TP+FP)

​TP, gerçek pozitif sayısını temsil ederken, FP yanlış pozitif sayısını temsil eder. Hassasiyet ne kadar yüksek olursa, modelin pozitif tahminlerinin gerçekten pozitif olma olasılığı o kadar yüksek olur.

Duyarlılık (Recall): Duyarlılık, gerçek pozitiflerin ne kadarının model tarafından tespit edildiğini ölçer. Yani, gerçek pozitiflerin tüm pozitifler içindeki oranını ifade eder. Örneğin, bir hastalığı teşhis eden bir modelde, duyarlılık, gerçekten hastalıklı olan hastaların ne kadarının doğru bir şekilde tespit edildiğini gösterir. Duyarlılık şu şekilde hesaplanır:

Duyarlılık=TP/(TP+FN)

TP, gerçek pozitif sayısını temsil ederken, FN yanlış negatif sayısını temsil eder. Duyarlılık ne kadar yüksek olursa, modelin gerçek pozitifleri tespit etme yeteneği o kadar iyidir.

F1 Skoru: F1 skoru, hassasiyet ve duyarlılığın harmonik ortalamasıdır. Bu nedenle, hem hassasiyetin hem de duyarlılığın dengeli bir şekilde iyi olmasını isteyen durumlar için kullanışlıdır. Özellikle, dengesiz sınıf dağılımlarına sahip veri setlerinde kullanılabilir. F1 skoru, aşağıdaki formülle hesaplanır:

F1 = 2 × ((Hassasiyet × Duyarlılık) / (Hassasiyet + Duyarlılık))

F1 skoru, hem hassasiyetin hem de duyarlılığın yüksek olmasını teşvik eder. Bu nedenle, modelin dengeli bir performans sergilemesi için önemli bir ölçüttür.