BİLDİRİLER   

GAZİ ÜNİVERSİTESİ MÜZİK EĞİTİMİ ANABİLİM DALI GİRİŞ-MÜZİK YETENEK SINAVLARININ GEÇERLİK VE GÜVENİRLİK YÖNÜNDEN İNCELENMESİ VE DEĞERLENDİRİLMESİ

GAZİ  ÜNİVERSİTESİ MÜZİK EĞİTİMİ ANABİLİM DALI

GİRİŞ - MÜZİK YETENEK SINAVLARININ

GEÇERLİK VE GÜVENİRLİK YÖNÜNDEN

İNCELENMESİ VE DEĞERLENDİRİLMESİ

Dr. Süleyman TARMAN

Ankara AGSL

 

* Cumhuriyetimizin 80. Yılında Müzik

Sempozyumu, 30-31 Ekim 2003,

İnönü Üniversitesi, Malatya

Bildiriler,s.363-377.

ÖZET

Bu araştırmada Gazi Üniversitesi Müzik Eğitimi Anabilim Dalı 1998 yılı “Giriş - Müzik Yetenek Sınavı” geçerlik ve güvenirlik yönünden incelenmiş ve değerlendirilmiştir. Söz konusu Müzik Yetenek Sınavı’nın (MYS), -verilerinin uygunluğuna bağlı olarak- “yordama geçerliği” ve “puanlama güvenirliği” belirlenmiştir.

 MYS’nin yordama geçerliğine ilişkin korelasyon katsayısı 0.32 (P<0.05), çoklu korelasyon katsayısı 0.41 (P=0.05) ve düzeltilmiş korelasyon katsayısı da 0.54’dür. MYS, düzeltilmiş korelasyon katsayısına göre üç yıllık toplam müziksel akademik başarının % 29’unu açıklamaktadır. Bu sonuç, MYS’nin yordama geçerliğinin olduğunu göstermektedir. 

MYS’nin puanlama güvenirliğine ilişkin korelasyon katsayısı hem “Kendall’s W”, hem de “Anova Tek Yönlü Varyans Analizi” yöntemiyle 0.99 bulunmuştur. Bu katsayı MYS’de puanlayıcılar arası tutarlığın çok yüksek olduğunu göstermektedir. Ancak güvenirlik katsayısının yüksek çıkmasını, bir yandan puanlayıcıların “birbirleriyle tutarlı ve puanlamada yansız davrandıkları” şeklinde, öte yandan da “birbirlerinden bağımsız olmadıkları”  şeklinde yorumlamak olasıdır.

Bunların ışığında MYS’nin yordama geçerliğinin yükseltilmesi için MYS yönergesinden soruların deşifresini kolaylaştıran ve adayların sınava hazır olarak gelmelerini sağlayan tanım ve ifadeler çıkarılmalı, MYS’nin kapsamı yeniden düzenlenmeli ve MYS’ye başvuran adayların profili göz önüne alınarak Anadolu Güzel Sanatlar Lisesi (AGSL) mezunu olanlar ve olmayanlar için birbirinden farklı, iki ayrı MYS hazırlanmalı ve uygulanmalıdır. AGSL mezunu olmayanlara uygulanacak MYS’de “müziksel okuma-yazma” alt testi yer almamalı; AGSL mezunu olanlara uygulanacak MYS’de ise, günümüzde kullanılan alt testlere ek olarak müziksel çalma kapsamında “piyano çalma” alt testi ile “müzik kuramları” alt testi yer almalıdır. Ayrıca “deşifre” becerisi, “müziksel okuma-yazma” alt testinin yanısıra “müziksel  çalma ve söyleme” alt testlerinde de yoklanmalıdır. Bunu izleyen araştırmalarla MYS’nin “yapı-kapsam ve uyum geçerlikleri” belirlenmelidir.

MYS’nin puanlama güvenirliğinin hesaplanması, sadece puanlayıcılar arası uyuma ilişkin sonuçlar vermekte, ancak ölçme aracının ölçmek istediği nitelikleri kararlı bir şekilde ölçüp ölçmediğine ilişkin sonuçlar vermemektedir.  Bu nedenle MYS, diğer yöntemlerle de güvenirliği hesaplanabilir duruma getirilmelidir. Ayrıca puanlama yapan komisyon en az beş kişiden oluşturulmalı ve puanlayıcıların birbirinden bağımsız olarak puan vermelerine daha çok özen gösterilmelidir.


VALIDITY AND RELIABILTY OF

MUSICAL APTITUDE EXAMS OF

GAZI UNIVERSITY DEPARTMENT OF MUSIC

 

ABSTRACT

In this study, theMusical Aptitude Examsfor enterance to the Gazi University, Department of Music Education have been assessed and evaluated for validity and reliability. Main intention was to find the coefficients of predictive validity and interscorer reliability of the Music Aptitude Test (MAT), provided that the data are appropriate.

Regarding the predictive validity of the tests, analysis showed that the Pearson correlation coefficient is 0.32 (P<0.05). The multiple regression analysis revealed a correlation coefficient of 0.41 (P=0.05), while correction for attenuation gave the correlation coefficient of  0.54. These results indicate that the MAT can be accounted for 29 % of the three years of academic achievement in music. Therefore, MAT has power of predictive validity.

As for the interscorer reliability, the correlation coefficient has been found as 0.99 using bothKendall’s W” andAnova One Way Variance Analysismethods. This coefficient suggests a considerably high reliability among the judges. It is possible to interpret this result as “unbiased and consistent scoring” of judges, but also as “un-independent scoring.”

To increase the predictive reliability of MAT, considering the profiles of applicants, two different tests should be prepared and applied for candidates who are graduated from the Anatolian High School of Fine Arts (AHSFA) and who are not. MAT for regular candidates should not include subtest of “musical reading and writing”, while MAT for AHSFA graduates should additionally include subtests of “musical playingpianoandmusic theory.” Furthermore, sight-reading skills should also be measured in “musical playing and singingsubtest beside themusical reading and writingsubtest.

Calculation of interscorer reliability of MAT only measures the consistency of judges, but not the reliability of the MAT as a tool to measure aptitudes. Therefore, reliability of MAT should be calculated by other methods. For test-retest method, MAT should be applied twice to the same applicant group, evaluating the differences. For parallel forms assessment, two equivalent MAT should be prepared, and both tests should be applied twice to the same applicant group for evaluating the scores. For internal consistency, +/- (true/false) coding should be used in scoring of “musical hearing-perception and reading-writingtests, instead of total scores noted on judge matrix. Additionally, a special attention should be paid to independent scoring of MAT and scoring jury should have at least five judges.

Upon the findings on validity and reliability of MAT, realizing the above suggestions, MAT can be enhanced as a measuring tool to be more evident in terms of objectivity, and internal and external consistency.


GİRİŞ

Ülkemizde gerek yükseköğretim ve gerekse ortaöğretim düzeyinde mesleki müzik eğitimi veren birçok kurum bulunmaktadır. Bu kurumların başlıcaları eğitim fakültelerinin müzik eğitimi anabilim dalları, güzel sanatlar fakültelerinin müzik bilimleri (müzikoloji) bölümleri, konservatuarlar, müzik ve sahne sanatları fakülteleri ile Anadolu güzel sanatlar liseleridir (AGSL). Mesleki müzik eğitimi veren bu kurumların tümünün ortak özelliği ise, girişte yapılan bir müzik yetenek sınavı ile öğrenci alıyor olmalarıdır. Bu sınavlarda adayların, programın gerektirdiği “müziksel davranışlara” ve/veya “müzik yeteneğine” sahip oluş düzeyleri saptanmaya çalışılmakta ve her kurum bu temel boyutları saptamak bakımından kendine özgü bir “müzik yetenek testi” uygulamaktadır.

Ancak ne yazık ki varlığı ve düzeyi, müzik yetenek testleriyle ölçülmeye çalışılan müziksel davranış ya da müzik yeteneği kavramlarının tanımları gerek dünya literatüründe ve gerekse ülkemizde henüz açık-seçik biçimde ifade edilebilmiş değildir. Araştırmaya ışık tutması bakımından bu temel kavramların tanımlarını yapmakta yarar vardır.

Müziksel Davranış; müziksel uyarıcıya verilen tepkidir ve dört temel boyutu vardır (Boyle ve Radocy 1987:86). Bunlar aşağıdaki gibidir:

a.       Müziksel performans (bir çalgı çalma ya da şarkı söyleme)

b.       Okuma ve yazma davranışları

c.       Dinleme (işitme) davranışları

d.       Müzikle ilgili diğer bilişsel davranışlar 

Müzik Yeteneği;  bireylerin müziksel işitme-ayrımsama, müziksel okuma-yazma ve müziksel söyleme-çalma gücüdür (Tarman 2002:11).

Müzik Yetenek Testi; bireylerin müziksel işitme-ayrımsama, müziksel okuma-yazma ve müziksel söyleme-çalma davranışlarının düzeyini saptamak amacıyla kullanılan ölçme aracıdır (Tarman 2002:11).

Ülkemizde bugüne kadar müzik yeteneğini ölçmek için uygulanan sınavların, ne derecede hatalardan arınık olduğuna ve ne derecede istenilen özellikleri ölçtüğüne ilişkin araştırmalar  henüz oldukça azdır. Başka bir deyişle sadece bu sınavların geçerlik ve güvenirliği ile sınırlı bir araştırma henüz yapılmamıştır. Bu bakımdan bu araştırma, Müzik Yetenek Sınavları’nın geçerlik ve güvenirliğinin derli toplu biçimde ilk kez belirlenmesi bakımından önem taşımaktadır. Araştırma sonucunda ortaya çıkan bulguların ve önerilerin, testin geliştirilmesine katkıda bulunması ve diğer kurumlarda uygulanan benzer sınavlara da ışık tutması beklenmektedir. Ancak araştırmayla ilgili bilgilerden  önce konunun anlaşılmasını kolaylaştırmak amacıyla geçerlik ve güvenirlik kavramlarının da hatırlatılmasında yarar vardır.

Geçerlik; bir ölçme aracının ölçmek istenilen özelliği ölçme derecesidir. Terminolojide farklı geçerlik türlerine rastlansa da  çoğu bilim adamlarınca kabul gören geçerlik türleri aşağıdaki gibidir (Boyle&Radocy, 1987; Anastasi, 1988; Oğuzkan, 1993, Tezbaşaran, 1996; Özçelik, 1997; Turgut, 1997; Baykul,2000).  

1.       Yapı Geçerliği (Construct Validity)

2.       Kapsam Geçerliği (Content Validity)

3.       Ölçüt Geçerliği (Criterion Validity)

a.       Uyum Geçerliği (Concurrent Validity)

b.       Yordama Geçerliği (Predictive Validity)

Yordama Geçerliği; testlerden elde edilen bir “yordayıcı puan” ile gelecekteki durumlarla ilgili bir “ölçüt”e ilişkin değerler arasındaki korelasyon katsayısıdır.

Güvenirlik; ölçme sonuçlarının tesadüfi hatalardan arınıklık derecesidir. Güvenirlik hesaplamada kullanılan çeşitli yöntemler vardır. Bu yöntemlerin seçimi, bir testin iki kez ya da bir kez uygulanmasına göre değişiklik gösterirler. (Boyle & Radocy, 1987; Anastasi, 1988; Özçelik, 1997; Turgut, 1997). Bir testin iki kez uygulanmasıyla yapılan güvenirlik hesaplama yöntemleri “Test-Tekrar-Test Yöntemi” (Test-Retest Reliability) ve “Eşdeğer Formlar Yöntemi” (Parallel Forms Reliability) dir. Bir testin bir kez uygulanmasıyla yapılan güvenirlik hesaplama yöntemleri ise “İki-Yarı (Spearman-Brown) Yöntemi” (Split-halves Reliability) ve “İç Tutarlılık Yöntemleri” (Internal Consistency Methods) dir. Ancak burada sözü edilen güvenirlik hesaplama yöntemleri genellikle kağıt-kalemle uygulanan testlerin güvenirliklerini belirlemede başvurulan yollardır.

Bunların dışında güvenirlik hesaplamada “puanlayıcılar arasındaki tutarlığa” dayalı bir yöntem daha vardır ki buna da “puanlama güvenirliği (interscorer reliability)” denir (Boyle & Radocy, 1987: 61; Anastasi, 1988: 124).

1.1 Araştırmanın Konusu

Araştırmanın konusu, Gazi Üniversitesi Gazi Eğitim Fakültesi Güzel Sanatlar Eğitimi Bölümü Müzik Eğitimi Anabilim Dalı’na girişte uygulanan 1998-1999 öğretim yılı “Müzik Yetenek Sınavı”nın ölçme teknikleri bakımından ele alınarak geçerlik ve güvenirliğinin incelenmesi ve değerlendirilmesidir.

1.2 Araştırmanın Amacı

Araştırmanın amacı, müzik öğretmenliği eğitimi programına girişte uygulanan müzik yetenek sınavının ne derecede geçerli ve güvenilir olduğunu saptamaktır. Bir başka deyişle araştırmada, yetenek sınavına alınan adayların, girecekleri programın müzik alanı için gerekli olan temel beceri ya da yeteneklere sahip olup olmadıklarını ve sahipseler derecesini belirleyen testlerin, ne derecede geçerli ve güvenilir bir ölçme aracı olduğunu saptamak, bu yolla Müzik Yetenek Sınavının daha belirgin ve nesnel bir ölçme aracı haline gelmesine  katkı sağlamaktır. Bu amaç doğrultusunda aşağıdaki problem ile alt problemler oluşturulmuştur.

1.3 Problem ve Alt Problemler

 “Gazi Üniversitesi Giriş-Müzik Yetenek Sınavı”nın geçerlik ve güvenirlik düzeyi nedir?

1.3.1 Yordama Geçerliğine İlişkin Alt Problemler

1.       Müziksel İşitme-Algılama ve Okuma-Yazma Testi’nden (T1) alınan puanlar ile Müzik Teorisi ve İşitme Eğitimi Dersi puanları arasında anlamlı bir ilişki var mıdır?

2.       Müziksel İşitme-Algılama ve Okuma-Yazma Testi’nden (T1) alınan puanlar ile performans gerektiren tüm derslerin puanları arasında anlamlı bir ilişki var mıdır?

3.       Müziksel Çalma Testi’nden (T2) alınan puanlar ile Piyano Eğitimi, Bireysel Çalgı Eğitimi, Okul Çalgıları, Orkestra-Oda Müziği, Eşlik (Koropetisyon) ve Elektronik Org Eğitimi Dersleri puanları arasında anlamlı bir ilişki var mıdır?

4.       Müziksel Söyleme Testi’nden (T3) alınan puanlar ile Bireysel Ses Eğitimi, Toplu Ses Eğitimi ve  Koro Dersleri puanları arasında anlamlı bir ilişki var mıdır?

5.       Müzik Yetenek Sınav Puanı (MYSP) ile 1.Yıl, 2.Yıl, 3.Yıl ve Üç yıllık Genel Müziksel Akademik Başarı ortalaması arasında anlamlı bir ilişki var mıdır?

6.       Müzik Yetenek Sınavı’nın “Yordama Geçerliği” nedir?

1.3.2 Puanlama Güvenirliğine İlişkin Alt Problemler

1.       Müziksel İşitme ve Algılama Testi’nde (T1a), puanlayıcılar arasında tutarlık düzeyi nedir?

2.       Müziksel Okuma ve Yazma Testi’nde (T1b), puanlayıcılar arasında tutarlık düzeyi nedir?

3.       Müziksel Çalma Testi’nde (T2) , puanlayıcılar arasında tutarlık düzeyi nedir?

4.       Müziksel Söyleme Testi’nde (T3), puanlayıcılar arasında tutarlık düzeyi nedir?

5.       Müzik Yetenek Sınavının tümünde  “Puanlama Güvenirliği” nedir?

2.1 Araştırmada İzlenen Geçerlik ve Güvenirlik Belirleme Yöntemleri

Araştırmada geçerlik ve güvenirlik yöntemlerinden verilerin uygunluğuna bağlı olarak MYS’nin “Yordama Geçerliği” ve “Puanlama Güvenirliği”,  “ilişkisel tarama modeli”, “korelasyon” ve “regresyon” türü ilişkisel çözümleme yöntemleri ile hesaplanmıştır. İzlenen model gereği Gazi Üniversitesi Müzik Eğitimi Anabilim Dalı 1998 yılı MYS’nin:

Yordama Geçerliğinin Belirlenmesi İçin; Öğrencilerin MYS’nin alt testlerinden ve tümünden aldıkları puanlar ile 3 yıl süresince aldıkları belli derslerle ilgili başarı puanları ve toplam akademik başarıları arasındaki ilişki  korelasyon ve regresyon yöntemleri ile karşılaştırılmıştır. Bu karşılaştırmalarda; “Pearson”, “Kendall” ve “Spearman” isimleriyle anılan korelasyon hesaplama yöntemlerinin tamamı kullanılmış, ancak araştırmanın bulgular ve yorum kısmında sadece “Pearson Momentler Çarpımı Korelasyon Katsayısı”na yer verilmiştir.

Puanlama Güvenirliğinin Belirlenmesi İçinMYS’nin her bir alt testinde görev alan 3 jüri üyesinin adaylara vermiş olduğu puanlar arasındaki tutarlık hem “Kendall’s W” hem de “Anova Tek Yönlü Varyans Analizi” yöntemleri ile hesaplanmış ve araştırmanın bulgular ve yorum kısmında her iki yöntemle de elde edilen katsayılara yer verilmiştir.

2.2 Desen

Yukarıda söz edilen nedenlerden dolayı araştırmanın geçerlik ve güvenirlik olmak üzere iki deseni vardır.

2.2.1 Geçerlik Deseni

Yordama geçerliğini hesaplamada MYS’nin alt testleri olan Müziksel İşitme Testi’nden (T1)* alınan puanlar ile Müzik Teorisi ve İşitme Eğitimi ve performans (çalma-söyleme) gerektiren tüm dersler; Müziksel Çalma Testi’nden (T2) alınan puanlar ile çalma performansı gerektiren tüm çalgı dersleri; Müziksel Söyleme Testi’nden (T3) alınan puanlar ile şarkı söyleme performansı gerektiren tüm dersler ve Müzik Yetenek Sınavı Puanı (MYSP) ile de 1.Yıl, 2. Yıl, 3 Yıl Başarı Ortalamaları ve 3 yıllık toplam genel müziksel akademik başarı arasındaki ilişki incelenmiştir. Bu doğrultuda hazırlanan Geçerlik Deseni Şekil 2.1’deki gibidir.

Şekil 2.1     Geçerlik Deseni

*T1 puanı; 1. Aşama Müziksel İşitme –Yineleme Puanı’nın %30’u ile

2. Aşama Müziksel Okuma-Yazma Puanının %70’inin toplamından oluşmaktadır.

2.2.2 Güvenirlik Deseni

Puanlama güvenirliğini hesaplamada, MYS’nin alt testlerinden olan 1. Aşama Müziksel İşitme ve Algılama Testi (T1a), 2. Aşama Müziksel Okuma ve Yazma Testi (T1b), Müziksel Çalma Testi (T2) ve Müziksel Söyleme Testi’nde (T3) görev alan jüri üyelerinin adaylara vermiş oldukları puanlar arasındaki tutarlık incelenmiş ve her bir alt testin tutarlığından hareketle tüm testin (MYS) güvenirliği bulunmuştur. Bu doğrultuda hazırlanan Güvenirlik Deseni de Tablo 2.1’de gösterilmiştir.

 

Tablo 2.1     Güvenirlik Deseni

2.3 Evren

            Bu araştırmanın evrenini GÜGEF Müzik Eğitimi Anabilim Dalı Giriş-Müzik Yetenek Sınavları ve bu sınavlar ile bölüme alınan öğrenciler oluşturmaktadır. Ancak evren her ne kadar Gazi Üniversitesi gibi gözükse de Türkiye’deki diğer üniversitelerin Müzik Eğitimi Anabilim Dalları da bu evren içinde düşünülebilir. Çünkü söz konusu diğer üniversiteler bölüme öğrenci alımında, temel boyutları bakımından neredeyse bu teste eşdeğer bir test kullanmakta, başka bir deyişle hemen hemen aynı yöntemle öğrenci seçmektedirler.

2.4 Örneklem

1998 yılında uygulanan MYS’nin  eleme niteliği taşıyan 1. aşamasındaki Müziksel İşitme ve Algılama (T1a) testi 427 adaya uygulanmıştır. Bu adaylardan test yönergesinde belirtildiği üzere 50 puanın üstünde alan 268 kişi, seçme niteliği taşıyan 2. aşama sınavlarına girmeye hak kazanmıştır. Bu sınavlardan Müziksel Okuma-Yazma Testi (T1b) 259 kişiye, Müziksel Çalma Testi (T2) 264 kişiye ve Müziksel Söyleme Testi (T3) de 268 kişiye uygulanmıştır. 1998 MYS sonrası bölüme 60 kişi kayıt yaptırdığı halde daha sonra çeşitli nedenlerle kayıtlarını donduran, bölümden ayrılan  ve yatay/dikey geçişle bölüme kayıt yaptıran 4 öğrenci olmuştur. Her bir testin uygulandığı kişi sayısındaki farklılıklar nedeniyle sayısal olarak “geçerlik örneklemi” ile “güvenirlik örneklemi” farklılaşmaktadır. Geçerlik ve güvenirlik dağılımını yansıtan farklılıklar Tablo 2.2’de gösterilmiştir.

Tablo 2.2     Geçerlik ve Güvenirlik Örneklemi

 

n (Kişi Sayısı)

T1a

T1b

T2

T3

MYS

Güvenirlik

427

259

264

268

259

Geçerlik

-

-

-

-

56

 

2.4 Araştırma Konusu MYS’nin Kapsamı

Araştırmacı tarafından MYS ve alt testlerine ilişkin boyutların bir arada ve bir bütün olarak kolayca anlaşılabilmesi için Gazi Üniversitesi Giriş-Müzik Yetenek Testi Kapsam Tablosu geliştirilmiştir. 1998 yılında uygulanan MYS’nin her bir alt testine ait madde türleri, madde sayısı ve puanları ile her bir alt testin ağırlıklı puanlarını gösteren “G.Ü. Giriş-Müzik Yetenek Sınavı Kapsamı” Tablo 2.3’deki gibidir.

Tablo 2.3    G.Ü. Giriş-Müzik Yetenek Sınavı (MYS) Kapsamı (Tarman, 2002)

MÜZİK YETENEK SINAVI

(MYS)

Madde Türleri

MİAT

 (T1a)

MOYT

(T1b)

MÇT

(T2)

MST

(T3)

Sayısı

Puanı

Toplam

Sayısı

Puanı

Toplam

Puan

Puan

Tek Ses

10

2

20

-

-

-

-

-

İki Ses

7

2

14

-

-

-

-

-

Üç Ses

4

3

12

-

-

-

-

-

Dört Ses

1

4

4

-

-

-

-

-

Ezgi

8

5

40

-

-

-

-

-

Ritim

8

1.25

10

-

-

-

-

-

Dikte

-

-

-

8

6.25

50

-

-

Solfej Deşifre

-

-

-

4

12.5

50

-

-

Teknik Düzey

-

-

-

-

-

-

15

-

Rahatlık-Doğallık

-

-

-

-

-

-

10

-

Doğruluk ve Temizlik

-

-

-

-

-

-

35

30

Müziksel Yorum

-

-

-

-

-

-

20

15

Bütünlük

-

-

-

-

-

-

20

5

Konuşmada Anlaşılırlık

-