PENDAHULUAN
Penilaian kinerja adalah gambaran
sistematik mengenai individu atau kelompok yang bersangkutan dengan kekuatan
dan kelemahan pekerjaan. Meskipun masalah-masalah teknis (pemilihan format) dan
masalah-masalah orangnya (daya tahan pengawas, politik-politik organisasi)
keduanya mengganggu penilaian performa, tetapi keduanya tidak dapat diatasi.
Penilaian kinerja terdiri dari dua
proses, Observation dan Judgement, keduanya merupakan persoalan
terhadap bias. Untuk alasan inilah, beberapa menyatakan bahwa penilaian
performa dinilai secara satupersatu yang didasari dengan objektivitas indikasi
seperti data produksi dan data karyawan (kecelakaan, penghargaan). Ketika data secara kebetulan menarik, kita tidak selalu mengukur performa, tetapi faktor-faktor yang melebihi kontrol individu; kita tidak hanya mengukur setiap perilaku, tetapi lebih dari itu berupa hasil dari perilaku.
Karena definisi tersebut, kriteria subjektivitas
(penilaian pengawas) selalu digunakan. Biar bagaimanapun, apabila penilaian
tergantung pada judgment seseorang, maka pada saat itu rentan sekali terhadap
bias. Masing-masing metode yang tersedia untuk penilaian performa kerja
berusaha untuk mengurangi bias dari segala sisi, sekalipun tetap saja tidak ada
metode yang benar-benar terbebas dari bias. Bias-bias mungkin diasosiasikan
dengan penilai/raters (kekurangan pengetahuan akan performa karyawan), orang
yang dinilai/ratees (jenis kelamin, usia kerja), interaksi raters dengan ratees
(ras dan gender), atau variasi situasional dan karakteristik organisasi.
Biar bagaimanapun, bias dapat dikurangi
dengan baik melalui training antara teknis dan aspek-aspek manusia mengenai
proses penilaian. Training harus juga
mengacu pada ketidaksesuaian peran yang berpotensi menuntut supervisor (pelatih
dan penilai) selama wawancara penilaian kinerja. Salah satu pendekatan
keberhasilan secara khusus untuk melakukan hal ini adalah mengizinkan
patisipasi lebih dari subordinat dalam proses penilaian dengan mengatur
kesetujuan bersama terhadap goal dan masa depan performa.
Performance
appraisal, gambaran sistematik mengenai kekuatan dan
kelemahan yang bersangkutan dengan pekerjaan di dalam dan di antara karyawan atau kelompok, dan
merupakan salah satu topik yang sangat sulit dalam managemen HR. Para peneliti tertarik dengan topik ini; namun
ketidakmampuan mereka secara keseluruhan untuk menyelesaikan masalah-masalah
teknis penjelasan rumit dari penilaian kinerja telah menyebabkan satu resensi
untuk istilah itu dengan "Achilles
hell" dari manajemen SDM (Heneman, 1975). Supervisor dan bawahan yang
berkala memberi penilaian, baik sebagai
pemberi rating atau tingkat, sering curiga terhadap pemakaian informasi
tersebut. Mereka sangat sadar akan implikasi politik dan praktis dari rating
dan, dalam banyak kasus, yang sangat nyaman selama wawancara penilaian kinerja.
Banyak
treatment penilaian kinerja hampir berisi petunjuk dari nada emosi, masalah
manusia, sehingga terikat erat dengan itu. Penekanan utama ditempatkan pada
masalah teknis-misalnya, keuntungan dan kerugian dari berbagai sistem
peringkat, sumber kesalahan, dan masalah-masalah dari ketidakpercayaan dalam
performa observasi dan pengukuran.
1. PURPOSES SERVED
Dalam
konteks human resource management,
penilaian performa formal dibuat dengan beberapa tujuan:
- Mereka
dapat menyajikan sebagai dasar untuk employment
decisions, keputusan mempromosikan orang terbaik, orang yang
berkemampuan rata-rata atau low
performance; melatih, mentransfer atau disiplin yang lain; dan
meningkatkan jasa. Secara singkat, penilaian dilakukan sebagai kunci input
untuk pengadministrasian sistem reward dan punishment dalam sebuah organisasi
formal.
- Penilaian
dapat disajikan sebagai criteria dalam HR research (validasi tes)
- Penilaian dapat disajikan sebagai predictor.
- Penilaian dapat membantu membuat objektivitas terhadap program training (menemukan
perilaku apa yang diharapkan).
- Penilaian menyediakan feadback konkrit pada pegawai.
Meningkatkan performa karyawan di masa selanjutnya dan membantu mengurangi
kelemahan yang dimiliki oleh karyawan.
- Penilaian dapat memfasilitasi diagnosa dan
perkembangan organisasi. Misalnya, perlu tidaknya
training dilakukan melihat penilaian yang telah dilakukan terhadap
performa karyawan, hal ini untuk meningkatkan perkembangan organisasi ke
arah yang lebih baik.
2.
REALITIES OF APPRAISAL
Secara mandiri dari setiap konteks organisasi, penilaian performa manusia dalam menghadapi pekerjaan dinilai dengan empat realitas
:
- Aktivitas ini tidak bisa dihindari pada semua organisasi, besar atau
kecil, umum atau pribadi, domestik atau multinational. Organisasi perlu
mengetahui kompetensi performa individu, dan dalam situasi sekarang ini, penilaian
adalah hal-hal yang esensial dari sebuah organisasi menolak
atau
mempertahankan tindakan pegawai, misalnya seperti pemberhentian tetap atau pemberhentian sementara.
- Mengadakan penilaian untuk
memberikan konsekuensi pada individu (reward, punishment) dan
organisasi (menyediakan reward dan punishment yang tepat didasarkan pada performa)
- Penilaian
performa juga dilaksanakan sebagai peningkatan compleksivitas pekerjaan
- Saat mempertimbangkan penempatan co-worker, dalam hal ini merupakan sebuah penghindaran dari sebagian pengaruh
konsekuensi tindakan politik, mereward peserikatan dan mempunish musuh
atau kompetitor.
3.
BARRIERS TO EFFECTIVE APPRAISAL
Rintangan-rintangan terhadap kesuksesan penilaian performa mungkin berasal
dari organisasi, politik, atau
interpersonal.
3.1.Organization Barriers
Menurut
Deming (1986), variasi dalam kinerja dalam sistem mungkin terjadi karena penyebab umum
atau sebab khusus. Penyebab umumnya adalah kesalahan yang dibangun ke dalam
sistem karena keputusan sebelumnya, cacat material, cacat dalam desain sistem,
atau beberapa kekurangan manajerial lainnya. penyebab
khusus karena peristiwa tertentu, dengan operator tertentu, atau untuk
subkelompok di dalam sistem.
3.2.Political Barriers
Pertimbangan
politis adalah fakta organisasional dalam hidup. Banyak manager tidak akan
mengijinkan nilai rating yang memiliki akurasi yang sangat tinggi yang akan
menyebabkan masalah bagi mereka sendiri, dan mereka berusaha untuk menggunakan
proses penilaian untuk keuntungan mereka sendiri (Longenecker et al, 1987).
3.3.Interpersonal Barriers
Karena
kurangnya komunikasi, karyawan mungkin berpikir bahwa mereka dinilai
berdasarkan satu set standard, ketika supervisor mereka menggunakan standard
yang berbeda. Lebih jauh lagi, supervisor sering menunda atau menolak untuk
membuat penilaian dengan bertatap muka. Daripada memberikan pekerja yang
dibawah standard dengan rating yang rendah, umpan balik yang negatif, dan gaji
dibawah rata-rata, supervisor sering memberikan rating yang rata-rata atau di
atas rata-rata kepada pekerja tersebut (Benedict dan Levine, 1988).
Akhirnya,
beberapa manager komplain bahwa wawancara formal dalam penilaian performansi
cenderung dicampur dengan hubungan pelatihan yang lebih konstruktif yang
seharusnya ada antara atasan dan bawahan. Mereka mengklaim bahwa
wawancara penilaian menekankan posisi superior dari supervisor dengan
menempatkannya dalam peran penilai, ini berlawanan dengan peran penting
supervisor untuk mengajar dan melatih (Meyer, 1991).
Banyak
penelitian tentang penilaian telah fokus
pada isu pengukuran. Hal ini
penting, tetapi HR yang profesional mungkin lebih berkontribusi dengan
meningkatkan komponen sikap dan interpersonal dalam sistem penilaian
performansi sebagaimana aspek teknis mereka.
3.4.Fundamental Requirement of Appraisal Systems
Agar sistem penilaian dapat berguna dengan sukses, penilaian harus memenuhi dua persyaratan dasar.
a.
Harus
relevan dengan pekerjaan
b.
Dapat
diterima oleh rater dan rate
Para rater harus menerima pentingnya penilaian
performansi dan umpan balik sebagai sebuah tujuan organisasi, mereka harus
menerima sistem penilaian sebagai maksud yang efektif untuk mencapai tujuan
tersebut, dan mereka harus menerima penilaian performansi yang akurat sebagai
tujuan personal (Ilgen dan Barnes-Farrel, 1984). Mungkin cara terbaik untuk
melakukannya adalah dengan mendasarkan penilaian performansi yang dilakukan
rater pada kualitas rating bawahannya.
Dari perspektif karyawan, sebuah studi mengindikasikan
bahwa karyawan lebih suka menerima sebuah sistem penilaian dan percaya bahwa
performansi mereka dinilai dengan adil dan akurat jika (Landy, Barnes dan
Murphy, 1978):
a.
Performansi
sering dievaluasi
b.
Karyawan
merasa bahwa supervisor mereka familiar dengan performansi kerja mereka
c.
Karyawan
merasa mereka memiliki peluang untuk mengungkapkan perasaan mereka selama
wawancara penilaian
d.
Tujuan
performansi yang baru, berdasarkan penilaian, disusun selama wawancara
penilaian
Selain relevansi dan penerimaan, sistem penilaian harus
sensistif (yaitu mampu membedakan pekerja yang efektif dan tidak efektif),
reliable, dan praktis (Cascio, 1982). Persyaratan kunci ini menyarankan bahwa
proses penilaian performansi adalah sama pentingnya dengan metode tertentu yang
digunakan.
4.
BEHAVIORAL
BASIS FOR PERFORMANCE APPRAISAL
Penilaian
kerja meliputi dua proses yaitu observasi dan penilaian (judgement). Observasi merupakan proses yang lebih mendasar, dan
meliputi pendeteksian, persepsi, dan recall atau recognisi perilaku yang
spesifik dari suatu kejadian. Sedangkan proses penilaian (judgement) terdiri dari organisasi,
integrasi, dan pengevaluasian informasi. Dalam prakteknya, observasi dan
judgement berada pada elemen terakhir dari tiga urutan :
o Job analysis
(deskripsi mengenai pekerjaan dan persyaratan personal dari tiap pekerjaan).
o Performance appraisal
(deskripsi pekerjaan
yang relevan terkait kelebihan dan kelemahan dari tiap individu).
o Performance standart
(menerjemahkan job requirement, sehingga nantinya akan dilihat apakah
kinerjanya berada pada level acceptable/unacceptabl
).
Job analysis
mengidentifikasi komponen-komponen dari tiap pekerjaan. Tujuan dari performence
appraisal itu sendiri adalah bukan untuk membuat perbedaan antar pekerjaan,
melainkan untuk membuat perbedaan antar individunya, khususnya diantara
individu yang berada pada pekerjaan yang sama. Performance standart berfungsi untuk memberikan link yang jelas
dalam proses tersebut.
Standar
kerja merupakan level atau tingkatan pekerjaan yang dianggap acceptable atau unacceptable terhadap relevansi pekerjaan, dan area kritis dari
pekerjaan yang teridentifikasi melalui job
analysis. Beberapa standar pekerjaan ada yang bisa diletakkan dalam dasar
studi enginering ( misal, produksi atau maintenance
). Yang lainnya, ada juga seperti penelitian, pengajaran, atau administrasi,
yang prosesnya menggunakan pertimbangan yang lebih subjektif dan hal ini sering
terjadi pada manajer dan persetujuan dari bawahan. Standar yang ada biasanya
bersifat konstan pada individu dalam tiap pekerjaan yang diberikan, sementara
tujuan sering ditentukan secara indovidu atau oleh suatu kelompok.
Standar
kerja sangat penting dalam semua jenis layanan organisasi dan produksi yang baik,
hal ini bertujuan untuk memastikan kekonsistensian dalam supervisory judgement terhadap individu yang berada pada pekerjaan
yang sama. Sayangnya, hal ini sering memunculkan tuduhan perlakuan
tidak adil dan diskriminasi yang
tidak adil dalam pekerjaan
di mana tidak ada standar kerja yang jelas. Kita tidak boleh terlalu menekankan kepentingan
mereka.
Penilaian kerja yang merupakan berada
pada urutan terakhir merepresentasikan proses yang aktual dari pengumpulan
informasi mengenai individu berdasarkan critical job requirement. Pengumpulan
informasi performa kerja dilakukan dengan observasi. Sedangkan pengevaluasian
kelayakan performa individu merupakan judgement ( penilaian ).
5. WHO
SHALL RATE ?
Dalam
melakukan penilaian kerja, menentukan siapa yang akan melakukan penilaian
sangatlah penting. Agar menjadi orang
yang koperatif dan terlatih dalam teknik penilaian, rater harus memiiki pengalaman langsung mengenai individu
yang akan dinilai. Berikut adalah lima perspektif mengenai siapa saja yang
melakukan penilain kerja.
5.1.Immediate
Supervisor
Immediate
supervisor atau yang disebut juga sebagai “360
degree feedback” dapat dilakukan oleh atasan langsung, rekan kerja,
bawahan, karyawan dari departemen lain yang berhubungan dengan karyawan yang
dinilai, serta orang lain di luar organisasi seperti pemasok atau konsumen yang
dapat menambah informasi terkait performa kerja karyawan. atasan
langsung bertanggung jawab untuk mengelola proses penilaian secara keseluruhan.
Sementara masukan dari bawahan dan rekan
kerja sangat membantu, supervisor sangat mampu dalam mengevaluasi setiap
kinerja bawahan sehubungan dengan keobjektifan organisasi secara keseluruhan.
Supervisor juga bertanggung jawab dalam memberikan reward ( punishment )
seperti gaji, promosi, dan disiplin, harus mampu membuat kinerja yang efektif (
tidak efektif ) aksi yang diambil oleh karyawan. Ketidakmampuan dalam
menghubungkan antara performa dan
hukuman/reward merupakan deficiencies yang sangat serius dalam beberapa sistem
penilaian.
5.2.Peer Assesment
Penilaian dari rekan kerja terdiri dari
tiga metode dasar yang digunakan oleh anggota dalam melakukan penilaian
terhadap tipa performa individu lainnya.
·
Peer nomination,
ini adalah yang paling banyak digunakan untuk mengidentifikasi tingkatan
individu dalam KSAOs ( knowledge, skill, ability, other characteristics )
·
Peer rating,
digunakan untuk pemberian feedback
·
Peer ranking,
sangat baik dalam mendiskriminasi variasi level performa mulai dari yang paling
tinggi hingga yang paling rendah.
Walaupun demikian, faktanya metode peer
assesment ini mencapai kesimpulan yang favorable mengenai reliabilitas,
validitas, dan pendekatan yang bebas bias.
Secara spesifik, karakteristik dari peer
assesment ini harus berhubungan secara signifikan dan independen terhadap peneimaan
pengguna. Bias persepsi dari teman berhubungan negatif terhdapa penerimaan
pengguna, dan penggunaan terhadap tujuan perkembangan berhubungan positif
terhadap penerimaan pengguna. Bagaimana individu dalam merespon penilaian
negatif yang diberikan oleh rekan kerja mereka ? Penelitian yang dilakukan
dalam setting terkontrol diindikasikan bahwa negatif feedback dari rekan kerja
menghasilkan persepsi terhadap performa kelompok lebih rendah, kohesivitas,
kepuasan, dan penilaian kelompok dalam tugas juga lebih rendah.
Solusi untuk meningkatkan nilai feedback
dan mengurangi bias persepsi adalah dengan membuat spesifikasi yang jelas
mengenai kriteria kerja yang mendasari peer assesment. Hasil dari peer
assesment kemudian digunakan dalam review mengenai progres karyawan yang
diikuti oleh karyawan-supervisor, sebelum adanya keputusan administratif akhir
mengenai karyawan.
Peer
assesment mungkin sangat baik
sebagai satu-satunya elemen dalam sistem
penilaian yang meliputi hasil dari semua sumber yang memiliki informasi unik
atau perspektif yang diberikan. Trait, perilaku, atau hasil yang dinilai harus
dipertimbangkan berdasarkan konteks kelompok dan situasi dimana peer assesment
diaplikasikan.
5.3.Appraisal by Subordinate
Bawahan memiliki perspektif yang berbeda
terhadap performa seorang manajer. Bawahan secara langsung tahu manajer yang
mana yang pantas/terutus, sejauh mana orang tersebut membuat perencanaan dan
pengorganisasian, jenis kepemimpinan apa yang paling nyaman, dan seberapa baik
orang tersebut dalam berkomunikasi. Pendekatan ini sering duginakan pada
universitas ( mahasiswa mengevaluasi fakultas ) dan terkadang juga digunakan
pada korporasi yang besar, dimana seorang manajer memiliki banyak sekali
bawahan. Dalam organisasi kecil
kepercayaan yang cukup dan keterbukaan diperlukan
sebelum penilaian bawahan bisa terlunasi.
Bawahan menilai manager mereka dua kali
dlam 6 bulan, penilain ini dilakukan dengan 33 aitem perilaku yang berfokus
pada kualitas dari komitmen manager, komunikasi, dukungan terhadap bawahan, dan
juga keadilan. Berdasarkan penilain bawahan, manager yang awalnya berada pada
level moderat atau rendah lalu meingkat secara perlahan selama periode 6 bulan,
maka peningkatan ini tidak diatribusikan semata-mata regresi yang berubah ke
mean. baik manajer dan bawahan menjadi
lebih mungkin dari waktu ke waktu
untuk menunjukkan bahwa manajer memiliki kesempatan untuk menunjukkan perilaku
diukur dengan instrumen umpan balik.
Melalui
penilaian ini ( subordinate appraisal
), dapat diperoleh informasi yang lebih akurat dan terinci mengenai perilaku
atasan karena bawahan sering bertemu dengan atasan. Masalah yang muncul adalah
bawahan tidak berani menilai atasannya karena takut akan ‘balas dendam’ yang
mungkin dilakukan atasan terhadap dirinya. Oleh karena itu, anonimitas
merupakan hal yang penting dalam penilaian oleh bawahan.
5.4.Self-Appraisal
Tiap individu memiliki alasan untuk
mmelakukan penilaian terhadap performa kerja mereka sendiri. Dilihat dari sisi
positifnya, dengan adanya kesempatan untuk bepartisipasi dalam penilaian kerja,
khususnya jika hal tersebut dikombinasikan dengan penentuan tujuan, maka ini
akan meningkatkan motivasi individu dan menurunkan defensiveness dari individu
selama wawancara penilaian. Jika dibandingkan dengan penilaian lainnnya yang
dilakukan oleh supervisor, rekan kerja/kelompok, dan bawahan, maka
self-appraisal ini cenderung lebih longgar, kurang variabel, cenderung lebih
banyak bias, dan kurang setuju dengan penilaian orang lain.
Penilaian
pribadi mengurangi sikap defensif terhadap penilaian orang lain. Namun
demikian, penilaian pribadi memiliki kelemahan, adanya penilaian yang cenderung
lebih tinggi daripada jika dilakukan oleh orang lain, dan seringkali tidak ada
kesepakatan mengenai tingkat kinerja berdasarkan penilaian karyawan dengan
penilaian dari atasan.
Berikut adalah beberapa cara untuk
meningkatkan validitas dari self-appraisal
:
1. Daripada
memberikan meminta individu untuk menilai diri mereka dengan skala absolute (mis,
skala dari rentang ‘poor’ – ‘average’), lebih baik berikan skala relatif yang
membuat mereka jadinya membandingkan diri mereka dengan yang lainnya (contoh,
“below average”, “average”, “above average”).
2.
Berikan kesempatan
ganda untuk self-appraisal, dengan keterampilan yang dievaluasi mungkin menjadi
salah satu meningkatkan dengan
praktik.
3.
Memberikan
jaminan kerahasiaan terkait self-appraisal yang tidak akan dipublikasikan
4.
Fokus
pada masa depan, khususnya dalam memprediksi perilaku di masa yang akan datang.
5.5.Appraisal
by Client Served
Kelompok lain
yang dapat memberikan perspektif berbeda pada performa individu dalam beberapa
situasi adalah klien yang dilayani. Contohnya, pada pekerjaan yang membutuhkan
interaksi kepada publik atau individu tertentu seperti sales atau suppliers. Appraisals terkadang oleh konsumen itu
sendiri. Informasi yang didapatkan dalam penilaian ini, dapat digunakan sebagai
bahan pertimbangan dalam pengambilan keputusan untuk pengembangan karyawan
seperti promosi, training, dan sebagainya.Selain itu, hal ini juga berguna
dalam penelitian yang dilakukan HR atau sebagai dasar bagi aktivitas
pengembangan diri. Akan tetapi, clients
served tidak dapat diharapkan untuk mengidentifikasikan secara keseluruhan dengan
objektivitas organisasi. Jadi, setiap sumber memiliki penilaiannya sendiri dan
menghasilkan perspektif yang berbeda. Hal ini dapat dilihat dalam tabel berikut
:
Use
|
Source
|
||||
Supervisor
|
Peers
|
subordinates
|
Self
|
Clients
served
|
|
Employeement
decisionts
|
x
|
x
|
X
|
||
Self-Development
|
x
|
x
|
x
|
x
|
X
|
Employment
Research
|
x
|
x
|
X
|
5.6.The
Multi-Trait-Multi-Rater Approach
Lawler (1967)
mengatakan bahwa untuk menilai derajat persetujuan inter-rater dalam dimensi rating
(validitas konvergen) dan untuk menilai kemampuan dari raters untuk membuat perbedaan dalam performa semua dimensi
(validitas diskriminan), sebuah matriks listing
dimension sebagai baris/deret dan raters
sebagai kolom harus dipersiapkan. Multiple
Rater untuk individu yang sama dapat digambarkan dari tingkat organisasi
yang berbeda, dan mereka mungkin mengamati faset yang berbeda dari performansi
pekerjaan orang yang dinilai. Karenanya, hal tersebut bisa jadi salah/keliru.
Sebagai
aternatif, hybrid multi-trait-multi-rater
dapat digunakan, dimana rater hanya
membuat evaluasi pada dimensi yang benar-benar cocok untuk dinilai (Borman,
1974). Metode ini merupakan konsep yang cocok untuk menganalisis penilaian
performansi, dan memiliki validitas konvergen dan diskriminan yang lebih tinggi
dari pada dengan menggunakan analisis multi-trait-multi-rater.
6.
JUDGEMENTAL BIASES IN RATING
Dalam
pandangan
tradisional, judgemental bias diakibatkan oleh beberapa kesalahan pengukuran di pihak
rater (penilai). Dengan demikian, mereka lebih mudah
ditangani daripada kesalahan yang non sistematis atau random. Namun, setiap jenis bias telah didefinisikan dan diukur
dengan cara yang berbeda dalam literatur. Menurut para manager, judgemental
bias
bukanlah
suatu
eror. Tetapi
lebih
mengarah
pada
kebijakan
mereka untuk memanage orang secara efektif.
6.1.Leniency and Severity
Penggunaan ratings bersandar pada asumsi bahwa
manusia memiliki ketelitian dan objektivitas yang cukup baik dalam melakukan
observasi.Rating tersebut dilakukan
untuk memperoleh aspek tertentu secara akurat dari orang yang dinilai. Dalam asumsi ini, objektivity yang menjadi kendala utama. Raters menilai dengan asumsi yang
dimilikinya sendiri (bisa jadi valid atau tidak) sedangkan sebagian besar
orang-orang telah berhadapan dengan raters
yang yang tampaknya mudah (toleran) dan susah (keras).
Bias leniency dan severity dapat
dikendalikan
atau
dihilangkan
dengan
beberapa
cara,
yaitu:
a. Mengalokasikan penilaian ke dalam distribusi
yang ketat, dimana orang yang dinilai dibagi secara adil ke dalam distribusi normal.
b. Mewajibkan supervisor
untuk member peringkat pada bawahannya.
6.2.Central Tendency
Ketika
menggunakan pertimbangan politik, penilai mungkin menetapkan semua nilai
bawahannya yang sangat baik dan sangat buruk. Mereka mencegah untuk menggunakan
skala penilaian yang ekstrim tinggi dan ekstrim rendah dan lebih cenderung
mengelompokkan seluruh penilaian di tengah-tengah skala. Hal ini dapat
mengurangi keakuratan dalam penilaian. Konsekuensinya adalah, sebagian besar
nilai dari penilaian performansi sistematis hilang. Penilaian tersebut gagal
untuk memisahkan keseluruhan atau antar individu, dan penilaian tersebut
menjadi tidak berguna sebagai alat dalam pengambilan keputusan manajerial,
seperti prediktor, kriteria atau feedback. Bias central tendensi dapat
diminimalisir dengan cara menetapkan dengan jelas maksud dari berbagai tanda
atau penilaian.
6.3.Halo
Halo
bias merupakan bias yang paling sering muncul dalam penilaian
kinerja. Seseorang dinilai baik tinggi atau rendah pada faktor-faktor tertentu karena
kesan umum si penilai tersebut (baik-buruk). Berdasarkan teori ini, rater gagal
dalam membedakan tingkat kinerja pada dimensi kinerja yang berbeda.
Tinjauan kritis dari
penelitian mengenai bias ini (Murphy, Jako, and Anhalt, 1993) mengemukakan tiga
kesimpulan, yaitu:
a. Halo tidak biasa seperti yang kebanyakan dipercaya.
b. Adanya halo tidak selalu mengurangi kualitas rating.
c. Tidak mungkin untuk memisahkan yang sebenarnya dari efek halo di sebagian besar keadaan.
Sebuah penelitian
menemukan bahwa penilaian yang dilakukan secara berkelompok lebih efektif dari pada
individual, tetapi kelompok juga menunjukkan bias respon yang lebih besar. Oleh
karena itu, kelompok dapat membantu tetapi mereka tidak dapat menghilangkan masalah
bias tersebut.
7.
TYPES
OF PERFORMANCE MEASURES
7.1.Objective Measures
Ukuran
kinerja objektif meliputi data produksi (volume penjualan dolar, unit yang
diproduksi, jumlah kesalahan, jumlah skrap) serta data kerja (kecelakaan,
turnover, absen, keterlambatan).Variabel-variabel ini secara langsung
menentukan tujuan organisasi dan sering mengalami beberapa kelemahan, dan yang
paling derius adalah tidak reliabel dan modifikasi kinerja oleh karakteristik
situasional.Pengukuran objektif tidak fokus pada perilaku, tetapi lebih pada
hasil atau hasil perilaku. Namun, telah diakui bahwa akan ada beberapa tumpang
tindih antara perilaku dan hasil, tetapi keduanya berbeda secara kualitatif.
Walaupun
ukuran objektif pada performansi secara naluriah menarik, keterbatasan teoritis
dan praktis sering membuat hal itu tidak cocok. Meskipun berguna bila dipakai
untuk penilaian pengawasan, korelasi antara ukuran objektif dan subjektif
sering rendah. Ketika digunakan sebagai dasar untuk keputusan kerja, kombinasi
dari langkah-langkah tersebut memiliki pertimbangan berbeda untuk
kelompok-kelompok etnis yang berbeda.
7.2.Subjective Measure
Kekurangan dari pengukuran
objektif membuat para peneliti dan manajer untuk fokus pada penilaian subjektif
dalam kinerja kerja. Namun, karena pengukuran subjektif tergantung pada human judgement, hal itu rentan terkena
bias. Sehingga harus didasarkan pada analisis yang cermat dari perilaku yang
diamati agar penilaian efektif.
Ada beberapa variasi
dalam jenis ukuran kinerja subjektif yang digunakan oleh organisasi. Beberapa menggunakan
daftar skala penilaian yang panjang dan rumit sedangkan yang lain hanya menggunakan
skala sederhana dan lainnya juga memerlukan manajer untuk menulis satu atau dua
paragraph tentang kinerja masing-masing bawahannya. Selain itu, ukuran subjektif
dapat relative (di mana perbandingan dibuat di antara sekelompok ratees) atau
absolute (di mana rate dijelaskan tanpa referensi kepada orang lain).
8.
RATING
SYSTEMS : RELATIVE AND ABSOLUTE
Dalam
taksonomi ini, beberapa metode berikut dapat dibedakan menjadi:
Relative
|
Absolute
|
Rank order
|
Essays
|
Paired comparisons
|
Behavior checklists
|
Forced distribution
|
Critical incidents
Graphic rating scales
|
8.1.Relative
Rating Systems (Employee Comparisons)
Simple
ranking adalah metode yang mengharuskan rater mengurutkan semua ratees dari urutan yang tertinggi sampai
urutan yang terendah, dari "karyawan terbaik" sampai "karyawan
terburuk". Alternation ranking mengharuskan rater menuliskan semua ratees
di selembar kertas, kemudian rater
memilih ratee terbaik (#1), lalu ratee terburuk (#n), kemudian kedua
terbaik (#2), lalu kedua terburuk (#n-1), dan seterusnya, bergantian dari
bagian atas sampai ke bagian bawah daftar sampai semua ratees selesai diranking. Baik
simple ranking maupun alternation ranking secara
tidak langsung membutuhkan rater untuk
membandingkan tiap ratee dengan ratee
lainnya,, tapi sistematika perbandingan ratee-to-ratee tidak dibuat untuk metode ini. Untuk hal ini kita memerlukan paired
comparisons. Jumlah pasangan ratees yang akan dibandingkan dapat
dihitung dengan rumus [n(n-1)]/2. Jika jumlah individu yang dibandingkan adalah
10 orang, [10(9)]/2 atau 45 perbandingan akan diperlukan. Tugas
rater disini secara sederhana adalah memilih yang terbaik dari setiap pasangan.
Dan peringkat masing-masing individu ditentukan dengan menghitung berapa kali
mereka dinilai unggul.
Employee
comparison methods mudah untuk dijelaskan dan dapat
membantu dalam membuat keputusan kerja. Mereka juga menyediakan
kriteria data yang berguna dalam studi validasi karena mereka memiliki kontrol
yang baik terhadap leniency, severity, dan
central tendency. Namun,
seperti sistem yang lainnya, metode ini juga memiliki beberapa kelemahan yang
harus dikenali. Biasanya karyawan hanya dibandingkan , atas
satu kategori yang cocok secara keseluruhan. Karena itu, ranking tidak memiliki kekhususan perilaku dan bisa melanggar
hukum. Selain itu, employee comparison
hanya menghasilkan data ordinal--data yang tidak memberikan indikasi jarak
relatif antara individu. Pada umumnya tidak mungkin
membandingkan ranking antar grup, departemen, atau lokasi. Dua masalah
terakhir dapat diatasi dengan mengubah ranking menjadi nilai
standard yang telah di normalisasikan, yang kemudian membentuk
distribusi mendekati normal.
Masalah
selanjutnya berasal dari kecenderungan employee
comparison methods untuk memberikan reward kepada anggota kelompok inferior
dan menghukum anggota kelompok superior. Reliabilitas akan
dipertanyakan ketika diminta untuk meranking ulang semua individu di kemudian
hari, namun Peringkat tinggi dan rendah mungkin saja tetap stabil, tapi peringkat
yang ditengah berkemungkinan berubah. Metode employee comparison yang terakhir adalah forced distribution. Forced
distribution memiliki keuntungan utama yaitu ia mengontrol leniency,
severity, dan central tendency
bias lebih efektif. Walaupuin begitu, hal ini kemungkinan menyebabkan ratee
akan menyesuaikan diri dengan distribusi normal, dan hal ini dapat mengarahkan
ke eror yang lebih besar jika kelompok ratee , sebagai kelompok, menjadi baik
itu unggul atau dibawah standar. Singkatnya, daripada menghilangkan eror , forced distribution malah mengarahkan
kita ke eror jenis lainnya.
8.2.Absolute
Rating Systems
Absolute rating system
memungkinkan seorang rater
untuk mendeskrisikan ratee tanpa
membuat referensi langsung untuk ratee lainnya. Mungkin absolute rating systems yang paling sederhana adalah narrative
essay, dimana rater diminta
untuk mendeskripsikan, secara lisan, kelebihan individu, kelemahan, dan potensi,
dan membuat saran untuk perbaikan. Asumsi yang mendasari pendekatan ini
adalah bahwa pernyataan jujur dari seorang rater yang berpengetahuan luas
terhadap kinerja ratee sama validnya dengan metode penilaian yang lebih formal
dan lebih rumit.
Keuntungan
dari narrative essay (ketika
dilakukan dengan tepat) adalah dapat memberikan feedback secara detail kepada ratee mengenai performa mereka. Di sisi
lain, essai hampir sepenuhnya tidak terstruktur, dan memiliki panjang dan isi
yang bervariasi. Perbandingan antar individu, kelompok, atau departemen hampir
tidak mungkin dilakukan karena setiap essai menyentuh aspek yang berbeda dari
setiap kinerja ratee atau kualifikasi
personal mereka. Pada akhirnya, essai hanya memberikan informasi kualitatif
saja, namun agar penilaian dapat mencakup kriteria atau agar dapat dibandingkan
secara obyektif dan diranking untuk tujuan keputusan kerja, beberapa bentuk
penilaian yang kuantitatif merupakan hal yang penting. Behavioral checklist
menyediakan satu skema seperti itu.
Behavioral
Checklists
Behavioral checklist
yang diberikan pada rater berisi serangkaian pernyataan deskriptif perilaku
yang berhubungan dengan pekerjaan. Dalam pendekatan ini rater tidak begitu
banyak mengevaluasi karena mereka hanya ditugaskan untuk melaporkan perilaku
kinerja ratee. Selain itu, penilaian deskripsi memiliki reliabilitas yang lebih
tinggi dibandingkan penilaian evaluative (Stockford&Bissell,1949).
Item
checklist dapat digunakan untuk membuat skala sikap. Salah satu metodenya dalah
Likert of summated ratings, (misalnya, dia melakukan beberapa strategi
pada penjualannya) diikuti beberapa kategori respon seperti “selalu”, “sangat
sering”, “sering”, “jarang” dan “tidak pernah”. Rater hanya memeriksa kategori
respon yang dia rasa menggambarkan ratee. Beberapa bobot kategori
respon, 5 (sering) dan 1 (tidak pernah) jika penyataan menggambarkan perilaku
yang diinginkan atau sebaliknya. Keseluruhan penilaian numeric untuk
beberapa individu kemudian didapatkan dari bobot yang dijumlahkan dari respon
yang diperiksa untuk beberapa item, dan skor untuk dimensi performa dapat
diperoleh menggunakan prosedur analisis item (Anastasi, 1988).
Penyeleksian
dari kategori respon untuk skala penilaian sering dibuat dengan interval yang
sama antara poin skala yang diasumsikan. Daftar skala dari perubahan keterangan
frekuensi dan penjumlahan yang secara statistik yang optimal dari 4 sampai 9
pada poin skala (Bass, Cascio, dan O’Connor, 1974). Nilai skala juga tersedia
untuk kategori persetujuan, evaluasi, dan frekuensi (Spector, 1976). Checklist mudah digunakan dan
dimengerti, tetapi terkadang memberikan kesulitan untuk rater dalam memberi diagnostic feedback yang didasarkan pada
checklist ratings, karena tidak
memberikan bentuk perilaku yang spesifik. Namun, keuntungan yang mungkin dari
checklist adalah dapat menggambarkan keseluruhan populasi yang dalam sebuah
organisasi.
Forced-Choice
Systems
Salah
satu jenis behavioral checklist adalah forced choice system,
sebuah teknik yang dikembangkan dengan spesifik untuk mengurangi kesalahan dan
menentukan standar yang objektif dari setiap perbandingan antarindividu
(Sisson, 1948). Checklist statements
biasanya disusun dalam bentuk kelompok, dimana rater memilih pernyataan yang sebagian besar atau setidaknya dapat
mendeskripsikan ratee tersebut.
Rating keseluruhan (skor) untuk setiap individu kemudian diperoleh dengan skor
yang telah ditetapkan untuk mendeskripsikan
ratee.
Forced-choice scales
dibentuk berdasarkan dua bentuk statistik dari checklist aitem: 1. Discriminability;
mengukur tingkat perbedaan item dari pekerja yang efektif sampai yang tidak
efektif, 2. Preference, derajat
indeks dari kualitas yang dinyatakan dalam bentul item yang dinilai (misalnya socially desirable) oleh orang-orang.
Dasar pemikiran dari forced-choice system
ini mengharuskan item berpasangan agar seimbang. Secara teoritis, dalam memilih
item tunggal yang akan dipasangkan seharusnya dibeda-bedakan berdasarkan pada
kekuatan item, bukan berdasarkan social
desirability.
Misalnya,
mempertimbangkan pasangan item:
1. Memisahkan
pendapat dari fakta dalam laporan tertulis.
2. Termasuk
informasi yang relevan dengan yang dituliskan dalam laporan.
Kedua
penyataan tersebut kira-kira sama, tapi
hanya item (1) yang ditemukan
untuk membedakan efektif dari pekerja yang tidak
efektif dalam depertemen
kepolisian. Ini mendefinisikan
karakteristik teknik forced-choice:
tidak semua pernyataan perilaku yang menarik sama validnya
Keuntungan
utama dari forced-choice scales
adalah rater tidak dapat memanipulasi jumlah nilai individu yang tinggi atau
rendah, karena mereka tidak mengetahui pernyataan yang mewakili nilai tersebut.
Sedangkan kerugiannya adalah rater
resistance. Kontrol yang hilang dari rater,
yang merasa tidak yakin pada penilaian subordinate
(dan bahkan mungkin memiliki efek negatif) dalam wawancara penilaian kinerja,
untuk rater yang tidak menyadari nilai-nilai dari skala item yang dipilihnya.
Kerjasama dan penerimaan rater merupakan penentu penting dari keberhasilan
setiap sistem penilaian, forced-chooice
systems cenderung menjadi pilihan yang tidak populer di banyak organisasi.
Crittical
Incidents
Metode
ini pada penilaian performa telah menghasilkan banyak kepentingan dalam beberapa tahun terakhir dan beberapa
variasi ide dasar yang saat ini digunakan. Flanagan (1954)
membuat perbedaan antara membuat suatu pekerjaan secara efektif dan melakukannya dengan efektif. Critical
incident hanya dilaporkan oleh observer yang berpengetahuan mengenai karyawan yang sangat efektif atau
tidak efektif dalam menyelesaikan pekerjaan mereka. Critical incident dicatat ketika terjadi
untuk setiap karyawan oleh atasannya. Mereka menilai kinerja berbasiskan
perilaku, misalnya dalam observasi seorang petugas polisi yang mengejar
perampok bersenjata yang diduga menyusuri jalan, seorang atasan mencatat:
“22
juni, petugas Mitchell ditahan dalam situasi menggunakan senjata, dimana
tembakan akan membahayakan saksi yang tidak bersalah.”
Metode critical incident terlihat
alami dalam wawancara penilaian kinerja karena atasan bisa fokus pada perilaku pekerjaan yang sebenarnya bukan pada trait. Retee menerima feedback dan mereka dapat melihat
perubahan dalam perilaku kerja mereka agar mereka dapat mengetahui apa yang
bisa dilakukan untuk meningkatkan performa kerja Selain itu, ketika sejumlah besar critical incident dikumpulkan,
diabstrakan, dan dikategorikan, mereka
dapat memberikan informasi
yang mendalam mengenai pekerjaan dan masalah organisasi secara umum dan sangat cocok untuk menetapkan tujuan program pelatihan (Flanagan dan Burns, 1995 ). Metode critical incident juga
memilki kelemahan, memakan waktu yang lama kepada supervisor untuk mencatat
kejadian untuk semua bawahannya dalam format perhari/perminggu.
Namun, dalam bentuk narasi mereka, insiden tidak mudah
digunakan untuk kuantifikasi, seperti yang dikatakan sebelumnya, menimbulkan
masalah dalam perbandingan antara-individu dan antara kelompok serta analisis
statistik. Untuk alasan ini dua variasi dari gagasan original telah disarankan.
Kirchner dan Dunnette (1957b), misalnya, menggunakan metode untuk mengembangkan
behavioral checklist (menggunakan metode penilaian yang dijumlahkan) untuk
merating performansi sales. Setelah insiden yang disarikan dan
diklasifikasikan, item yang dipilih kemudian dirancang menjadi checklist,
misalnya,
Gives good service on costumers
complaints
Strongly Agree Undecided Disagree Strongly
agree
disagree
Modifikasi kedua yang
merupakan pengembangan dari skala
penilaian berdasarkan perilaku, pendekatan
yang akan dibahas pada bagian
berikutnya.
Graphic Rating Scales
Graphic rating scale
adalah salah satu metode penilaian performa yang mungkin lebih banyak
digunakan. yang mana contohnya dapat di lihat pada
Figure 5-4. Yang dibedakan dalam 3 hal:
1. Sejauh
mana arti dari kategori respon yang dapat di defenisikan.
2.
Sejauh
mana individu yang menginterpretasikan penilaian (seorang HR manager) dapat
mengatakan secara jelas respon apa yang dimaksudkan.
3.
Sejauh
mana dimensi performa yang
dinilai didefinisikan untuk penilai.
Sebuah graphic rating scale memiliki poin yang digambarkan secara
kontinum. Oleh karena itu, Dalam urutan membuat pembedaan dalam dimensi
performa, poin skala harus digambarkan secara tidak ambigu untuk rater, proses
ini disebut anchoring. Skala a menggunakan anchor kualitatif saja. Skala b termasuk numerical dan verbal anchor, sedangkan
skala c, d, dan f menggunakan
menggunakan anchor lisan. Tinggi atau rendahnya kualitas ditentukan penilai.
Skala e lebih baik menjelaskan
kualitas dalam konteks tertentu. Skala berbeda dalam hal definisi dimensi
kinerja. Skala a dan c hampir tidak menjelaskan definisi
kualitas, skala b menggabungkan
kuantitas dan kualitas menjadi satu dimensi, dan skala d dan e mendefinisikan
kualitas dalam hal yang berbeda sama sekali (yakni thoroughness, dependability,
dan neatness vs accuracy, effectiveness, dan freedom from error). Skala f
adalah peningkatan, sedangkan kualitas mewakili akurasi, efektivitas, inisiatif
( kombinasi definisi dari skala d dan
e), setidaknya rating yang terpisah
dibutuhkan di setiap aspek kualitas.
Gambar
5-4 adalah bagian dari skala penilaian grafis yang digunakan untuk me-rate
perawat. Respons kategori yang jelas, individu menginterpretasikan apa
tanggapan yang dimaksudkan penilai, dan dimensi kinerja didefinisikan bahwa
penilai dan ratee memahami dan dapat menyetujui.
Skala
penilaian grafis (1) sedikit memakan waktu dalam pengembangan dan pengelolaan,
(2) memungkinkan hasil kuantitatif yang ditentukan, (3) mempertimbangkan lebih
dari satu dimensi kinerja, dan (4) distandarisasi dan sebanding terhadap
seluruh individu. Di sisi lain, skala penilaian grafis memberikan kontrol
maksimal kepada penilai, dengan demikian tidak punya kendali atas leniency, severity, central tendency,
atau halo. Karena alasan-alasan
tersebut, hal ini dikritik. Namun, ketika skala penilaian grafis sederhana
dibandingkan dengan forced-choice rating
yang lebih canggih, skala grafis secara konsisten terbukti dapat diandalkan,
valid (King et al., 1980) dan lebih diterima oleh penilai. (Bernardin dan
Beatty, 1984).
Behaviorally Anchored Rating scale (BARS)
Bagaimana skala penilaian grafis ditingkatkan? Menurut Smith dan
Kendall (1963)
“Penilaian lebih baik dapat diperoleh, tidak
melalui trik terhadap penilai, namun membantu mereka untuk menilai. Kita dapat memberikan pertanyaan yang dapat
dijawab secara jujur mengenai perilaku yang dapat diamati. Kita juga harus
meyakinkan mereka bahwa jawaban tidak akan disalahpahami serta menyediakan
dasar dimana dia dan yang lain dapat memeriksa jawabannya.”
Prosedurnya
adalah berikut. Pada awal pertemuan, sekumpulan pekerja dan atau pengawas
berusaha untuk mengenali dan menjelaskan semua dimensi yang penting dari
performa yang efektif dari tugas yang khusus., Grup yang kedua kemudian
menghasilkan , untuk setiap dimensi peristiwa kritis yang menggambarkan
performa yang efektif, rata-rata dan tidak efektif. Grup yang ketiga kemudian
diberi daftar dimensi dan pengertiannya, selama daftar yang acak dari peristiwa
kritis yang dihasilkan oleh grup ke dua.
Tugas mereka adalah menyingkat atau menempatkan peristiwa kedalam dimensi yang
mereka wakili paling baik.
Prosedur
ini dikenal dengan retranslasi sejak hal ini mirip dengan pemeriksaan kendali
kualitas yang digunakan untuk memastikan kecukupan penerjemahan dari satu
bahasa ke bahasa lain. Materinya diterjemahkan kedalam bahasa asing dan diterjemahkan ulang ke bentuk aslinya dengan
penterjemah yang independen.
Dalam
konteks penilaian performa, prosedur ini
memastikan bahwa pemahaman kedua dimensi kerja dan peristiwa perilaku dipilih
untuk menggambarkan hal yang spesifikdan jelas. Peristiwa dieliminasi tergantung pada dimana dimensi berada.
Sebaliknya dimensi mungkin ditambahkan jika banyak peristiwa dialokasikan pada
kategori yang lain.
9. SUMMARY COMMENTS ON
RATING FORMATS AND RATING PROCESS
Bagi
jutaan pekerja saat ini khususnya yang
bergerak di asuransi , telekomunikasi, transportasi dan industry perbankan
sedang diawasi oleh computer selambekerja adalah fakta kehidupan.
Dalam
kebanyakan pekerjaan , penilaian pada manusia mengenai performa kerja
individual adalah hal yang pasti, Tak masalah format mana yang digunakan. Ini
adalah masalah terbesar dengan semua format.
Terkecuali
pengamatan terhadap orang yang dinilai ekstensif dan representative, hal ini
tidak mungkin dalam penilaian untuk menggambarkan performa yang nyata dari yang
dinilai, lalu, penilai juga membuat kesimpulan mengenai performa, penilaian
subjek terhadap semua bias yang terhubung dengan skala penilaian. Penilai bebas
untuk merusak penilaian untuk menyesuaikan dengan tujuannya. Hal ini dapat
membatalkan semua kerja sungguh-sungguh yang mengarah pada skala skala dan
mungkin menjelaskan kenapa tak ada format penilaian tunggal yang ditampilkan
superior terhadap yang lain.
Banks
dan Robinson menyarankan 2 strategi : Pertama, Bangun sebanyak mungkin struktur
agar meminimalkan keleluasaan yang diuji oleh penilai. Kedua, Jangan syaratkan
penilai untuk membuat penilaian yang
mereka tidak kompeten dalam hal tersebut.
10.
FACTORS
AFFECTING SUBJECTIVE APPRAISALS
Penilaian
kinerja merupakan suatu proses yang kompleks yang dapat dipengaruhi oleh
berbagai macam faktor, seperti organisasi, politik, dan hambatan interpersonal.
Dalam hal rating ada beberapa faktor yang mungkin berpengaruh, seperti
perbedaan individual pada rater dan ratee, serta interaksi antara rater dan
ratee. Berikut beberapa karakterikstik rater, ratee, dan interaksi antara rater
dan ratee yang berpengaruh dalam rating kinerja (untuk informasi lebih lanjut,
perhatikan tabel 5-3, 5-4, 5-5 dalam Cascio, 1998).
Karakteriktik
|
Rater
|
Ratee
|
Interaksi
antara Rater dan Ratee
|
Gender
|
Tidak memiliki efek umum
|
Wanita mendapat rating lebih rendah
ketika bekerja kurang dari 20 persen dalam kelompok dan mendapat rating lebih
tinggi ketika mencapai 50 persen
|
Dalam imbalan dan promosi, wanita
memperoleh rating bias negatif oleh rater yang memiliki stereotipe tentang
wanita
|
Tingkat kinerja
|
Performer yang efektif akan
menghasilkan rating yang reliabel dan valid
|
Tingkat kinerja dan kemampuan aktual
menimbulkan efek terbesar dalam rating
|
|
Pengetahuan tentang ratee dan
pekerjaan
|
Rating kurang akurat apabila memiliki
sedikit data
|
||
Prior expectations
|
Ketidaksesuaian harapan rater
menghasilkan rating yang lebih rendah
Informasi awal dapat menimbulkan bias
Rating menilai perilaku tampak
|
||
Stres
|
Rater yang stres cenderung membuat
penilaian berdasarkan kesan pertama
|
Dari
tabel di atas, dapat diketahui efek dari perbedaan individu dalam rating
kinerja. Hal ini dapat menjelaskan mengapa reliabilitas, perubahan, dan
konsistensi terjadi dalam rating. Selain itu, informasi di atas juga dapat
menjelaskan sebab terjadinya bias dan pemrosesan informasi yang digunakan rater
dalam mengevaluasi data. Dengan demikian, informasi yang diperoleh dapat
digunakan untuk memperbaharui konten pada pelatihan rater sehingga menghasilkan
penilaian yang berkualitas.
11.
RATER TRAINING
Langkah
awal dalam merancang suatu pelatihan adalah menspesifikkan tujuan. Dalam
pelatihan rater ada tiga tujuan, yaitu :
a. Meningkatkan
kemampuan obsevasi rater terkait “apa” yang harus diperhatikan
b. Mengurangi
atau menghilangkan penilaian yang bias
c. Meningkatkan
kemampuan rater untuk mengkomunikasikan informasi penilaian secara objektif
kepada ratee.
Dari
berbagai macam pelatihan rater, peneliti menganggap bahwa frame-of-reference training adalah yang paling efektif dalam
meningkatkan keakuratan penilaian kinerja. Berikut merupakan prosedur pelatihan
yang dikembangkan oleh Pulakos (Cascio, 1998).
1. Partisipan
diminta mengevaluasi tiga ratee dalam tiga dimensi kinerja yang terpisah.
2. Partisipan
diberi skala rating dan diminta untuk membaca definisi dimensi dan skala dengan
kuat seperti yang dicontohkan trainer.
3. Trainer
mendiskusikan perilaku ratee yang diilustrasikan dalam level performa yang
berbeda pada tiap skala yang bertujuan agar rater membuat suatu kesepakatan
terkait dimensi performa dan level yang tepat untuk perilaku yang berbeda.
4. Partisipan
ditunjukkan video praktikum dan diminta untuk mengevaluasi manajer yang
menggunakan skala.
5. Partisipan
menulis dan mendiskusikan hasil evaluasi atau rating yang telah dibuat. Trainer
mengindentifikasi perilaku partisipan dalam memutuskan rating dan
mengklarifikasi perbedaan dalam rating.
6. Trainer
memberikan feedback pada partisipan.
Frame-of-reference
training menyediakan skema yang membantu rater dalam
memproses informasi terkait kinerja. Skema ini akan membantu dalam encoding, penyimpanan,
dan retrival dari penilaian performa. Penggunaan nilai dalam performa dan
feedback selama training membantu rater untuk belajar langsung dan mengetahui
penggunaan standar rating. Dengan demikian, frame-of-reference
training merupakan suatu contoh dari proses dimana standar dimensi performa
diperoleh sehingga meningkatkan keakuratan dalam rating.
11.1.
The
Wider Context of Performanca Appraisal
Isu
terkait sikap dan perilaku merupakan hal yang ditekankan dalam penilaian
kinerja, namun format instrumen atau rating yang digunakan masih memiliki
keterbatasan dalam penskoran kinerja.
Ada
tiga penelitian yang mengukur implikasi dari sistem penilaian kinerja, yaitu
sebagai berikut.
a. Penelitian
Ivanveich (1980), terkait dampak jangka
panjang dari penggunaan BARS dalam organisasi. Pada tiga titik pengukuran
selama 20 bulan, diperoleh hasil bahwa 121 teknisi yang diukur dengan BARS
melaporkan sikap yang lebih baik terhadap sistem dan berkurangnya tension kerja
dibanding yang diukur dengan trait-oriented
scale. Namun, penelitian ini tidak mengunakan true control group design
sehingga tidak dapat dikatakan bahwa sistem BARS yang menyebabkan peningkatan
pada teknisi.
b. Penelitian
Mount (1983), yang mensurvei 612 manajer dan 1.550 karyawan dalam sebuah
perusahaan multinasional untuk mengukur kepuasan terhadap sistem baru penilaian
kinerja. Hasil yang diperoleh menunjukkan bahwa kepuasan berbeda tergantung
pada perspektif individu. Manajer menilai bahwa sistem menampilkan komponen
yang berbeda dibanding apa yang dilakukan karyawan. Manajer juga mengganggap
bahwa item yang ada menyinggung aturan perusahaan dan prosedur penilaian yang
berbeda. Sedangkan karyawan mempersepsikan aspek dari sistem secara global.
Kepuasan karyawan diukur dari pengalaman terhadap sistem, kualitas diskusi
penilaian, bagaimana sistem dapat mendiskusikan dan menyusun rencana
perkembangan selanjutnya.
c. Penelitian
Hogan (1987), terkait dampak dari harapan awal dalam rating. Hasil yang
diperoleh adalah ketidakcocokan antara harapan awal dan kinerja sebenarnya
mempengaruhi penilaian. Ketika kinerja sebenarnya lebih rendah dari harapan
awal, rating yang diperoleh akan lebih rendah dibanding performa sebenarnya.
12.
INFORMATION
FEEDBACK: APPRAISAL AND GOAL-SETTING INTERVIEWS
Salah satu tujuan
utama dari performance appraisal adalah
berfungsi sebagai pengembangan personal/pribadi, dalam rangka memperbaiki, harus ada beberapa umpan balik dari
kinerja. Efek umpan balik atas kinerja masa depan ini
telah didokumentasikan dengan baik (Ilgen, Fisher, dan
Taylor, 1979; Ilgen and Moore, 1987). Memang,
penelitian menunjukkan bahwa manajer juga harus mencari
kinerja yang negatif dari karyawan, tidak hanya yang positif saja, umpan balik yang diberikan dapat dari
berbagai sumber (atasan, teman sejabatan,
dan bawahan). Melakukan hal tersebut menghasilkan dua hal, yaitu: (1) akurat dalam
mendeteksi masalah kinerja, dan (2) dapat
menghasilkan sistem penilaian yang baik dari berbagai sumber umpan balik (Ashford dan
Tsui, 1991). Tanggung jawab untuk berkomunikasi seperti umpan balik
dari berbagai sumber ini dilakukan dengan wawancara penilaian kinerja oleh atasan langsung (Ghorpade dan Chen, 1995).
Idealnya,
proses umpan balik yang berkelanjutan harus ada di antara atasan dan bawahan, sehingga
keduanya dapat petunjuk. Namun, dalam prakteknya,
supervisor sering "menyimpan" informasi yang berkaitan dengan kinerja
untuk wawancara penilaian formal, pelaksanaan
yang merupakan pengalaman yang sangat
melelahkan untuk kedua
belah pihak. Kebanyakan supervisor menolak "playing God" (memainkan peran hakim)
dan kemudian mengkomunikasikan penilaian mereka kepada bawahan (McGregor,
1957). Oleh karena itu,
supervisor dapat menghindari
menghadapi masalah tidak nyaman, tetapi jika masalah tersebut terjadi,
bawahan cenderung akan menolak
atau merasionalisasikan mereka dalam upaya untuk mempertahankan harga diri (Larson, 1989). Dengan demikian, proses ini merugikan
diri sendiri bagi kedua belah pihak. Untungnya kebutuhan ini tidak selalu terjadi. Berdasarkan
temuan dari penelitian wawancara penilaian, tabel 5-6 menyajikan beberapa kegiatan
yang supervisor harus terlibat dalam sebelum, selama, dan setelah wawancara
penilaian. Mari
secara singkat kita mempertimbangkan
masing-masing.
Frequent Communication.
Dua
hasil yang paling jelas dari penelitian tentang wawancara penilaian adalah, bahwa sekali setahun penilaian kinerja
adalah nilai yang dipertanyakan,
dan pembinaan yang harus dilakukan lebih sering khususnya
bagi yang berkinerja buruk atau dengan karyawan baru (Cederblom, 1982; Meyer, 1991). Umpan
balik memiliki pengaruh yang maksimal ketika diberikan sedekat mungkin dengan
tindakan. Jika seorang bawahan
bertindak efektif katakan segera, jika ia bersikap tidak efektif, juga katakan
segera.
Appraisal Training. Seperti yang kita
catat sebelumnya, peningkatan penekanan
harus ditempatkan pada penilai pelatihan untuk mengamati, perilaku yang lebih akurat dan adil dibandingkan pada penyediaan perilaku ilustrasi spesifik
"bagaimana" atau "tidak bagaimana" tingkat. manajer pelatihan untuk memberikan informasi evaluatif dan memberikan umpan balik. Pelatihan
manajer untuk memberikan informasi evaluatif dan memberikan umpan balik harus
difokuskan pada karakteristik manajerial yang sulit untuk dinilai dan
karakteristik yang orang kira mudah untuk dinilai tapi hal itulah yang biasanya
menyebabkan perselisihan. Seperti faktor pengambilan risiko
dan pengembangan bawahan (Wohler dan London, 1989).
Judge Your Own Performance First. Kita seringkali menggunakan norma atau standart
kita sendiri dalam menilai orang lain. Meskipun kecenderungan ini sulit untuk
diatasi, temuan penelitian di bidang persepsi interpersonal dapat membantu
meningkatkan proses, yaitu:
1.
Mekanisme perlindungan diri
seperti penyangkalan, menyerah, promosi diri, dan takut gagal memiliki pengaruh
negatif terhadap kesadaran diri.
2.
Mengetahui diri sendiri membuat lebih mudah
untuk melihat orang lain secara akurat dan kemampuan manajerial itu sendiri.
3.
Mengenal karakteristik
sendiri akan mempengaruhi cara pandang terhadap karakteristik
orang lain.
4.
Orang yang menerima dirinya lebih
mungkin untuk dapat melihat aspek yang menguntungkan orang lain.
5.
Akurat dalam memahami orang
lain bukan keterampilan tunggal (Wohlers and
London, 1989; Zalkind and Costello, 1962).
Encourage Subordinate Preparation. Penelitian yang dilakukan di sebuah
rumah sakit besar di Midwest menunjukkan bahwa semakin banyak waktu yang
dihabiskan karyawan untuk wawancara penilaian menganalisis tugas pekerjaan dan
tanggung jawab, masalah yang dihadapi di tempat kerja. dan lolos dari kinerja
mereka, semakin besar kemungkinan mereka harus puas dengan proses penilaian,
termotivasi untuk meningkatkan kinerja mereka, dan benar-benar untuk meningkatkan
kinerja mereka sendiri, dan benar-benar untuk meningkatkan kinerja mereka
(Burke, Weitzel, dan Weir, 1978). Hal-hal yang dapat dilakukan untuk
persiapan yaitu: (1) Bentuk
BARS bisa dikembangkan untuk tujuan ini dan bawahan dapat didorong atau
diwajibkan untuk menggunakannya (Silverman dan Wexley, 1984). (2) Karyawan dapat diberikan wawancara penilaian sebelumnya. (3) Karyawan dapat didorong atau diminta untuk menilai
kinerja mereka sendiri berdasarkan kriteria atau bentuk yang sama yang
digunakan pleh supervisor (Farth, Werbel, dan Bedeian, 1988).
Self-review memiliki setidaknya empat keuntungan: (1) Meningkatkan
martabat dan kehormatan diri bawahan; (2) Menempatkan peran manajer sebagai konselor, bukan
hakim; (3) Dapat
merumuskan rencana atau tujuan selama diskusi untuk mempromosikan karyawan; (4) Lebih memuaskan dan produktif bagi kedua belah pihak daripada sekedar
review manajer ke bawahan tradisional (Meyer, 1991).
Warm Up and Encourage Participation. Penelitian
menunjukkan bahwa pada umumnya bawahan merasa dia berpartisipasi dalam
wawancara dengan menyajikan gagasan-gagasan dan perasaannya, bawahan merasa
bahwa supervisor itu membantu dan konstruktif, bahwa beberapa masalah pekerjaan
dapat dibersihkan, dan bahwa tujuan di masa yang akan datang telah ditetapkan. Namun, kesimpulan yang benar selama wawancara
penilaian merupakan ancaman yang rendah untuk bawahan karena bawahan tersebut
sebelumnya telah menerima wawancara penilaian dari atasan, dia terbiasa untuk
berpartisipasi dan dia memiliki pengetahuan tentang isu-isu yang akan dibahas
dalam wawancara (Cederblom, 1982).
Judge Performance, not Personality. Lebih banyak pengawas fokus pada kepribadian dan tingkah laku dari
bawahan mereka dibandingkan aspek
perilaku yang berkaitan dengan pekerjaan mereka, semakin rendah kepuasan antara atasan dan bawahan maka semakin kecil
bawahan akan termotivasi untuk meningkatkan kinerjanya (Burke, dkk, 1978).
Be Spesific. Wawancara penilaian lebih mungkin berhasil jika pengawas dianggap
konstruktif dan membangun (Russell dan Goode, 1988). Dengan menjadi jelas dan
spesifik, supervisor memberikan umpan balik yang sangat jelas kepada bawahan
mengenai tindakan masa lalu. Supervisor dapat menunjukkan secara
spesifik tentang perilaku positif maupun negatif pada pekerjaan. Data
menunjukkan bahwa penerimaan dan keakuratan dari umpan balik oleh bawahan
sangat dipengaruhi oleh urutan informasi yang positif atau negatif disajikan. Memulai wawancara penilaian dengan umpan balik yang
positif diasosiasikan dengan masalah
kecil, yang dilanjutkan dengan membahas masalah besar. Pujian
tentang aspek minor
perilaku harus meletakkan individu nyaman, dan
mengurangi efek blocking disfungsional yang terkait dengan kritik (Stone, Gueutal,
dan McIntosh, 1984).
Be an Active Listener. Pendengar yang
aktif memperhatikan petunjuk-petunjuk verbal maupun petunjuk nonverbal, dan di
atas semuanya mereka menerima apa yang orang lain katakan tanpa argumen atau
kritik.
Ancaman masing-masing
individu dengan jumlah martabat yang
sama dan rasa hormat yang menuntut diri kita sendiri.
Avoid Destructive Criticism. Kritik yang merusak bersifat umum,
bernada kasar, dan sering yang dikritik itu atribut kinerja yang buruk
dikarenakan dari internal (misalnya, kurangnya motivasi atau kemampuan). Bukti
menunjukkan bahwa karyawan cenderung mengatributkan masalah kinerja dikarenakan
faktor-faktor di luar kendali mereka (misalnya, bahan yang tidak memadai,
peralatan, instruksi, atau waktu) sebagai mekanisme untuk mempertahankan harga
diri mereka (Larson, 1989). Tidak mengherankan, oleh karena itu, kritik yang
merusak menyebabkan tiga konsekuensi: (1) Menghasilkan
perasaan negatif di antara penerima dan dapat memulai atau meningkatkan konflik
antara individu-individu, (2) Mengurangi
preferensi penerima untuk menangani perselisihan di masa depan dengan memberi
umpan balik secara damai (misalnya, kompromi,
kolaborasi), dan (3) Memiliki efek negatif pada tujuan diri dan perasaan self-efficacy (Baron,
1988). Tak perlu dikatakan,
ini adalah salah satu jenis komunikasi yang akan dilakukan
manajer dan orang lain dengan baik
untuk menghindarinya.
Set Mutually Agreeable Goals. Ada tiga
alasan terkait mengapa penetapan tujuan mempengaruhi kinerja. Pertama, memiliki efek direktif artinya memfokuskan
kegiatan di satu arah tertentu lebih daripada yang lain. Kedua, mengingat bahwa tujuan diterima, orang cenderung mengerahkan usaha secara
proporsional dengan kesulitan tujuan. Terakhir, tujuan yang
sulit maka lebih tekun dalam mencapainya (yaitu, usaha diarahkan dari waktu ke
waktu) daripada tujuan yang mudah. Ketiga
dimensi, arah (pilihan), usaha, dan ketekunan, adalah pusat untuk
motivasi/proses penilaian (Katzell, 1994; Latham dan Wexley, 1981).
Continue to Communicate and Assess Progress Toward Goals Regularly. Ketika
pembinaan adalah kegiatan sehari-hari, bukan ritual sekali setahun, wawancara
penilaian dapat diletakkan dalam perspektif yang benar: Ini hanya memformalkan
sebuah proses yang harus terjadi secara teratur pula. Hal ini dilakukan dengan
tujuan membantu menjaga perilaku pada target, memberikan pemahaman yang lebih
baik tentang alasan di balik pemberian tingkat kinerja, dan meningkatkan
komitmen bawahan untuk kinerja yang efektif.
Make Organizational Rewards
Contingent on Performance. Hasil
penelitian jelas dipotong pada masalah ini. Bawahan yang melihat
hubungan antara hasil penilaian dan keputusan kerja lebih mungkin untuk
mempersiapkan wawancara penilaian, lebih mungkin aktif untuk mengambil bagian
di dalamnya, dan lebih mungkin puas dengan sistem penilaian (Burke et al.,
1978). Manajer,
pada gilirannya, akan mendapatkan
hasil lebih besar dari sistem penilaian mereka dengan mengindahkan hasil ini.
Kesimpulannya,
kita
sekarang memiliki banyak informasi berharga tentang proses penilaian yang dapat
dan harus diterapkan dalam organisasi. Hal ini harus dibangun ke dalam program
pelatihan pengawasan, dan harus dikomunikasikan kepada karyawan dalam upaya
untuk membuat hidup mereka bekerja lebih memuaskan dan bermakna dan untuk
meningkatkan kualitas kinerja organisasi secara keseluruhan.
DAFTAR PUSTAKA
Cascio,
Wayne F. (1998). Applied Psychology in
Human Resource Management, Fifth Edition. USA : Prentince Hall
Gambar diambil dari http://www.andriewongso.com/articles/details/13947/4-Tujuan-Evaluasi-Kinerja-Karyawan
0 komentar:
Posting Komentar