Pages

Selasa, 17 November 2015

Performance Appraisal (Penilaian Kinerja Karyawan)


PENDAHULUAN

Penilaian kinerja adalah gambaran sistematik mengenai individu atau kelompok yang bersangkutan dengan kekuatan dan kelemahan pekerjaan. Meskipun masalah-masalah teknis (pemilihan format) dan masalah-masalah orangnya (daya tahan pengawas, politik-politik organisasi) keduanya mengganggu penilaian performa, tetapi keduanya tidak dapat diatasi.
Penilaian kinerja terdiri dari dua proses, Observation dan Judgement, keduanya merupakan persoalan terhadap bias. Untuk alasan inilah, beberapa menyatakan bahwa penilaian performa dinilai secara satupersatu yang didasari dengan objektivitas indikasi seperti data  produksi dan data karyawan (kecelakaan, penghargaan). Ketika data secara kebetulan menarik, kita tidak selalu mengukur performa, tetapi faktor-faktor yang melebihi kontrol individu; kita tidak hanya mengukur setiap perilaku, tetapi lebih dari itu berupa hasil dari perilaku.           
Karena definisi tersebut, kriteria subjektivitas (penilaian pengawas) selalu digunakan. Biar bagaimanapun, apabila penilaian tergantung pada judgment seseorang, maka pada saat itu rentan sekali terhadap bias. Masing-masing metode yang tersedia untuk penilaian performa kerja berusaha untuk mengurangi bias dari segala sisi, sekalipun tetap saja tidak ada metode yang benar-benar terbebas dari bias. Bias-bias mungkin diasosiasikan dengan penilai/raters (kekurangan pengetahuan akan performa karyawan), orang yang dinilai/ratees (jenis kelamin, usia kerja), interaksi raters dengan ratees (ras dan gender), atau variasi situasional dan karakteristik organisasi.
Biar bagaimanapun, bias dapat dikurangi dengan baik melalui training antara teknis dan aspek-aspek manusia mengenai proses penilaian. Training harus juga mengacu pada ketidaksesuaian peran yang berpotensi menuntut supervisor (pelatih dan penilai) selama wawancara penilaian kinerja. Salah satu pendekatan keberhasilan secara khusus untuk melakukan hal ini adalah mengizinkan patisipasi lebih dari subordinat dalam proses penilaian dengan mengatur kesetujuan bersama terhadap goal dan masa depan performa.
Performance appraisal, gambaran sistematik mengenai kekuatan dan kelemahan yang bersangkutan dengan pekerjaan di dalam  dan di antara karyawan atau kelompok, dan merupakan salah satu topik yang sangat sulit dalam managemen HR. Para peneliti tertarik dengan topik ini; namun ketidakmampuan mereka secara keseluruhan untuk menyelesaikan masalah-masalah teknis penjelasan rumit dari penilaian kinerja telah menyebabkan satu resensi untuk istilah itu dengan "Achilles hell" dari manajemen SDM (Heneman, 1975). Supervisor dan bawahan yang berkala memberi  penilaian, baik sebagai pemberi rating atau tingkat, sering curiga terhadap pemakaian informasi tersebut. Mereka sangat sadar akan implikasi politik dan praktis dari rating dan, dalam banyak kasus, yang sangat nyaman selama wawancara penilaian kinerja.
Banyak treatment penilaian kinerja hampir berisi petunjuk dari nada emosi, masalah manusia, sehingga terikat erat dengan itu. Penekanan utama ditempatkan pada masalah teknis-misalnya, keuntungan dan kerugian dari berbagai sistem peringkat, sumber kesalahan, dan masalah-masalah dari ketidakpercayaan dalam performa observasi dan pengukuran.

1.      PURPOSES SERVED
            Dalam konteks human resource management, penilaian performa formal dibuat dengan beberapa tujuan:
  1. Mereka dapat menyajikan sebagai dasar untuk employment decisions, keputusan mempromosikan orang terbaik, orang yang berkemampuan rata-rata atau low performance; melatih, mentransfer atau disiplin yang lain; dan meningkatkan jasa. Secara singkat, penilaian dilakukan sebagai kunci input untuk pengadministrasian sistem reward dan punishment dalam sebuah organisasi formal.
  2. Penilaian dapat disajikan sebagai criteria dalam HR research (validasi tes)
  3. Penilaian dapat disajikan sebagai predictor.
  4. Penilaian dapat membantu membuat objektivitas terhadap program training (menemukan perilaku apa yang diharapkan).
  5. Penilaian menyediakan feadback konkrit pada pegawai. Meningkatkan performa karyawan di masa selanjutnya dan membantu mengurangi kelemahan yang dimiliki oleh karyawan.
  6. Penilaian dapat memfasilitasi diagnosa dan perkembangan organisasi. Misalnya, perlu tidaknya training dilakukan melihat penilaian yang telah dilakukan terhadap performa karyawan, hal ini untuk meningkatkan perkembangan organisasi ke arah yang lebih baik.
2.      REALITIES OF APPRAISAL
            Secara mandiri dari setiap konteks organisasi, penilaian performa manusia dalam menghadapi pekerjaan dinilai dengan empat realitas :
  1. Aktivitas ini tidak bisa dihindari pada semua organisasi, besar atau kecil, umum atau pribadi, domestik atau multinational. Organisasi perlu mengetahui kompetensi performa individu, dan dalam situasi sekarang ini, penilaian adalah hal-hal yang esensial dari sebuah organisasi menolak atau mempertahankan tindakan pegawai, misalnya seperti pemberhentian tetap atau pemberhentian sementara.
  2. Mengadakan penilaian untuk memberikan konsekuensi pada individu (reward, punishment) dan organisasi (menyediakan reward dan punishment yang tepat didasarkan pada performa)
  3. Penilaian performa juga dilaksanakan sebagai peningkatan compleksivitas pekerjaan
  4. Saat mempertimbangkan penempatan co-worker, dalam hal ini merupakan sebuah penghindaran dari sebagian pengaruh konsekuensi tindakan politik, mereward peserikatan dan mempunish musuh atau kompetitor.

3.      BARRIERS TO EFFECTIVE APPRAISAL
            Rintangan-rintangan terhadap kesuksesan penilaian performa mungkin berasal dari organisasi, politik, atau interpersonal.
3.1.Organization Barriers     
      Menurut Deming (1986), variasi dalam kinerja dalam sistem mungkin terjadi karena penyebab umum atau sebab khusus. Penyebab umumnya adalah kesalahan yang dibangun ke dalam sistem karena keputusan sebelumnya, cacat material, cacat dalam desain sistem, atau beberapa kekurangan manajerial lainnya. penyebab khusus karena peristiwa tertentu, dengan operator tertentu, atau untuk subkelompok di dalam sistem.

3.2.Political Barriers
Pertimbangan politis adalah fakta organisasional dalam hidup. Banyak manager tidak akan mengijinkan nilai rating yang memiliki akurasi yang sangat tinggi yang akan menyebabkan masalah bagi mereka sendiri, dan mereka berusaha untuk menggunakan proses penilaian untuk keuntungan mereka sendiri (Longenecker et al, 1987).
3.3.Interpersonal Barriers
Karena kurangnya komunikasi, karyawan mungkin berpikir bahwa mereka dinilai berdasarkan satu set standard, ketika supervisor mereka menggunakan standard yang berbeda. Lebih jauh lagi, supervisor sering menunda atau menolak untuk membuat penilaian dengan bertatap muka. Daripada memberikan pekerja yang dibawah standard dengan rating yang rendah, umpan balik yang negatif, dan gaji dibawah rata-rata, supervisor sering memberikan rating yang rata-rata atau di atas rata-rata kepada pekerja tersebut (Benedict dan Levine, 1988).
Akhirnya, beberapa manager komplain bahwa wawancara formal dalam penilaian performansi cenderung dicampur dengan hubungan pelatihan yang lebih konstruktif yang seharusnya ada antara atasan dan bawahan. Mereka mengklaim bahwa wawancara penilaian menekankan posisi superior dari supervisor dengan menempatkannya dalam peran penilai, ini berlawanan dengan peran penting supervisor untuk mengajar dan melatih (Meyer, 1991).
Banyak penelitian tentang penilaian telah fokus pada isu pengukuran. Hal ini penting, tetapi HR yang profesional mungkin lebih berkontribusi dengan meningkatkan komponen sikap dan interpersonal dalam sistem penilaian performansi sebagaimana aspek teknis mereka.

3.4.Fundamental Requirement of Appraisal Systems
Agar sistem penilaian dapat berguna dengan sukses, penilaian harus memenuhi dua persyaratan dasar.
a.       Harus relevan dengan pekerjaan
b.      Dapat diterima oleh rater dan rate
Para rater harus menerima pentingnya penilaian performansi dan umpan balik sebagai sebuah tujuan organisasi, mereka harus menerima sistem penilaian sebagai maksud yang efektif untuk mencapai tujuan tersebut, dan mereka harus menerima penilaian performansi yang akurat sebagai tujuan personal (Ilgen dan Barnes-Farrel, 1984). Mungkin cara terbaik untuk melakukannya adalah dengan mendasarkan penilaian performansi yang dilakukan rater pada kualitas rating bawahannya.
Dari perspektif karyawan, sebuah studi mengindikasikan bahwa karyawan lebih suka menerima sebuah sistem penilaian dan percaya bahwa performansi mereka dinilai dengan adil dan akurat jika (Landy, Barnes dan Murphy, 1978):
a.       Performansi sering dievaluasi
b.      Karyawan merasa bahwa supervisor mereka familiar dengan performansi kerja mereka
c.       Karyawan merasa mereka memiliki peluang untuk mengungkapkan perasaan mereka selama wawancara penilaian
d.      Tujuan performansi yang baru, berdasarkan penilaian, disusun selama wawancara penilaian
Selain relevansi dan penerimaan, sistem penilaian harus sensistif (yaitu mampu membedakan pekerja yang efektif dan tidak efektif), reliable, dan praktis (Cascio, 1982). Persyaratan kunci ini menyarankan bahwa proses penilaian performansi adalah sama pentingnya dengan metode tertentu yang digunakan.

4.      BEHAVIORAL BASIS FOR PERFORMANCE APPRAISAL
Penilaian kerja meliputi dua proses yaitu observasi dan penilaian (judgement). Observasi merupakan proses yang lebih mendasar, dan meliputi pendeteksian, persepsi, dan recall atau recognisi perilaku yang spesifik dari suatu kejadian. Sedangkan proses penilaian  (judgement) terdiri dari organisasi, integrasi, dan pengevaluasian informasi. Dalam prakteknya, observasi dan judgement berada pada elemen terakhir dari tiga urutan :
o   Job analysis (deskripsi mengenai pekerjaan dan persyaratan personal dari tiap pekerjaan).
o   Performance appraisal (deskripsi pekerjaan yang relevan terkait kelebihan dan kelemahan dari tiap individu).
o   Performance standart (menerjemahkan job requirement, sehingga nantinya akan dilihat apakah kinerjanya berada pada level acceptable/unacceptabl ).
Job analysis mengidentifikasi komponen-komponen dari tiap pekerjaan. Tujuan dari performence appraisal itu sendiri adalah bukan untuk membuat perbedaan antar pekerjaan, melainkan untuk membuat perbedaan antar individunya, khususnya diantara individu yang berada pada pekerjaan yang sama. Performance standart berfungsi untuk memberikan link yang jelas dalam proses tersebut.
Standar kerja merupakan level atau tingkatan pekerjaan yang dianggap acceptable atau unacceptable terhadap relevansi pekerjaan, dan area kritis dari pekerjaan yang teridentifikasi melalui job analysis. Beberapa standar pekerjaan ada yang bisa diletakkan dalam dasar studi enginering ( misal, produksi atau maintenance ). Yang lainnya, ada juga seperti penelitian, pengajaran, atau administrasi, yang prosesnya menggunakan pertimbangan yang lebih subjektif dan hal ini sering terjadi pada manajer dan persetujuan dari bawahan. Standar yang ada biasanya bersifat konstan pada individu dalam tiap pekerjaan yang diberikan, sementara tujuan sering ditentukan secara indovidu atau oleh suatu kelompok.
Standar kerja sangat penting dalam semua jenis layanan organisasi dan produksi yang baik, hal ini bertujuan untuk memastikan kekonsistensian dalam supervisory judgement terhadap individu yang berada pada pekerjaan yang sama. Sayangnya, hal ini sering memunculkan tuduhan perlakuan tidak adil dan diskriminasi yang tidak adil dalam pekerjaan di mana tidak ada standar kerja yang jelas. Kita tidak boleh terlalu menekankan kepentingan mereka.
Penilaian kerja yang merupakan berada pada urutan terakhir merepresentasikan proses yang aktual dari pengumpulan informasi mengenai individu berdasarkan critical job requirement. Pengumpulan informasi performa kerja dilakukan dengan observasi. Sedangkan pengevaluasian kelayakan performa individu merupakan judgement ( penilaian ).
5.      WHO SHALL RATE ?
Dalam melakukan penilaian kerja, menentukan siapa yang akan melakukan penilaian sangatlah penting.  Agar menjadi orang yang koperatif dan terlatih dalam teknik penilaian, rater harus  memiiki pengalaman langsung mengenai individu yang akan dinilai. Berikut adalah lima perspektif mengenai siapa saja yang melakukan penilain kerja.
5.1.Immediate Supervisor
Immediate supervisor atau yang disebut juga sebagai “360 degree feedback” dapat dilakukan oleh atasan langsung, rekan kerja, bawahan, karyawan dari departemen lain yang berhubungan dengan karyawan yang dinilai, serta orang lain di luar organisasi seperti pemasok atau konsumen yang dapat menambah informasi terkait performa kerja karyawan. atasan langsung bertanggung jawab untuk mengelola proses penilaian secara keseluruhan.
Sementara masukan dari bawahan dan rekan kerja sangat membantu, supervisor sangat mampu dalam mengevaluasi setiap kinerja bawahan sehubungan dengan keobjektifan organisasi secara keseluruhan. Supervisor juga bertanggung jawab dalam memberikan reward ( punishment ) seperti gaji, promosi, dan disiplin, harus mampu membuat kinerja yang efektif ( tidak efektif ) aksi yang diambil oleh karyawan. Ketidakmampuan dalam menghubungkan antara  performa dan hukuman/reward merupakan deficiencies yang sangat serius dalam beberapa sistem penilaian.
5.2.Peer Assesment
Penilaian dari rekan kerja terdiri dari tiga metode dasar yang digunakan oleh anggota dalam melakukan penilaian terhadap tipa performa individu lainnya.
·         Peer nomination, ini adalah yang paling banyak digunakan untuk mengidentifikasi tingkatan individu dalam KSAOs ( knowledge, skill, ability, other characteristics )
·         Peer rating, digunakan untuk pemberian feedback
·         Peer ranking, sangat baik dalam mendiskriminasi variasi level performa mulai dari yang paling tinggi hingga yang paling rendah.
Walaupun demikian, faktanya metode peer assesment ini mencapai kesimpulan yang favorable mengenai reliabilitas, validitas, dan pendekatan yang bebas bias.
Secara spesifik, karakteristik dari peer assesment ini harus berhubungan secara signifikan dan independen terhadap peneimaan pengguna. Bias persepsi dari teman berhubungan negatif terhdapa penerimaan pengguna, dan penggunaan terhadap tujuan perkembangan berhubungan positif terhadap penerimaan pengguna. Bagaimana individu dalam merespon penilaian negatif yang diberikan oleh rekan kerja mereka ? Penelitian yang dilakukan dalam setting terkontrol diindikasikan bahwa negatif feedback dari rekan kerja menghasilkan persepsi terhadap performa kelompok lebih rendah, kohesivitas, kepuasan, dan penilaian kelompok dalam tugas juga lebih rendah.
Solusi untuk meningkatkan nilai feedback dan mengurangi bias persepsi adalah dengan membuat spesifikasi yang jelas mengenai kriteria kerja yang mendasari peer assesment. Hasil dari peer assesment kemudian digunakan dalam review mengenai progres karyawan yang diikuti oleh karyawan-supervisor, sebelum adanya keputusan administratif akhir mengenai karyawan.
Peer assesment mungkin sangat baik sebagai satu-satunya  elemen dalam sistem penilaian yang meliputi hasil dari semua sumber yang memiliki informasi unik atau perspektif yang diberikan. Trait, perilaku, atau hasil yang dinilai harus dipertimbangkan berdasarkan konteks kelompok dan situasi dimana peer assesment diaplikasikan.
5.3.Appraisal by Subordinate
Bawahan memiliki perspektif yang berbeda terhadap performa seorang manajer. Bawahan secara langsung tahu manajer yang mana yang pantas/terutus, sejauh mana orang tersebut membuat perencanaan dan pengorganisasian, jenis kepemimpinan apa yang paling nyaman, dan seberapa baik orang tersebut dalam berkomunikasi. Pendekatan ini sering duginakan pada universitas ( mahasiswa mengevaluasi fakultas ) dan terkadang juga digunakan pada korporasi yang besar, dimana seorang manajer memiliki banyak sekali bawahan. Dalam organisasi kecil kepercayaan yang cukup dan keterbukaan diperlukan sebelum penilaian bawahan bisa terlunasi.
Bawahan menilai manager mereka dua kali dlam 6 bulan, penilain ini dilakukan dengan 33 aitem perilaku yang berfokus pada kualitas dari komitmen manager, komunikasi, dukungan terhadap bawahan, dan juga keadilan. Berdasarkan penilain bawahan, manager yang awalnya berada pada level moderat atau rendah lalu meingkat secara perlahan selama periode 6 bulan, maka peningkatan ini tidak diatribusikan semata-mata regresi yang berubah ke mean. baik manajer dan bawahan menjadi lebih mungkin dari waktu ke waktu untuk menunjukkan bahwa manajer memiliki kesempatan untuk menunjukkan perilaku diukur dengan instrumen umpan balik.
Melalui penilaian ini ( subordinate appraisal ), dapat diperoleh informasi yang lebih akurat dan terinci mengenai perilaku atasan karena bawahan sering bertemu dengan atasan. Masalah yang muncul adalah bawahan tidak berani menilai atasannya karena takut akan ‘balas dendam’ yang mungkin dilakukan atasan terhadap dirinya. Oleh karena itu, anonimitas merupakan hal yang penting dalam penilaian oleh bawahan.
5.4.Self-Appraisal
Tiap individu memiliki alasan untuk mmelakukan penilaian terhadap performa kerja mereka sendiri. Dilihat dari sisi positifnya, dengan adanya kesempatan untuk bepartisipasi dalam penilaian kerja, khususnya jika hal tersebut dikombinasikan dengan penentuan tujuan, maka ini akan meningkatkan motivasi individu dan menurunkan defensiveness dari individu selama wawancara penilaian. Jika dibandingkan dengan penilaian lainnnya yang dilakukan oleh supervisor, rekan kerja/kelompok, dan bawahan, maka self-appraisal ini cenderung lebih longgar, kurang variabel, cenderung lebih banyak bias, dan kurang setuju dengan penilaian orang lain.
Penilaian pribadi mengurangi sikap defensif terhadap penilaian orang lain. Namun demikian, penilaian pribadi memiliki kelemahan, adanya penilaian yang cenderung lebih tinggi daripada jika dilakukan oleh orang lain, dan seringkali tidak ada kesepakatan mengenai tingkat kinerja berdasarkan penilaian karyawan dengan penilaian dari atasan.
Berikut adalah beberapa cara untuk meningkatkan validitas dari self-appraisal :
1.      Daripada memberikan meminta individu untuk menilai diri mereka dengan skala absolute (mis, skala dari rentang ‘poor’ – ‘average’), lebih baik berikan skala relatif yang membuat mereka jadinya membandingkan diri mereka dengan yang lainnya (contoh, “below average”, “average”, “above average”).
2.      Berikan kesempatan ganda untuk self-appraisal, dengan keterampilan yang dievaluasi mungkin menjadi salah satu meningkatkan dengan praktik.
3.      Memberikan jaminan kerahasiaan terkait self-appraisal yang tidak akan dipublikasikan
4.      Fokus pada masa depan, khususnya dalam memprediksi perilaku di masa yang akan datang.

5.5.Appraisal by Client Served
Kelompok lain yang dapat memberikan perspektif berbeda pada performa individu dalam beberapa situasi adalah klien yang dilayani. Contohnya, pada pekerjaan yang membutuhkan interaksi kepada publik atau individu tertentu seperti sales atau suppliers. Appraisals terkadang oleh konsumen itu sendiri. Informasi yang didapatkan dalam penilaian ini, dapat digunakan sebagai bahan pertimbangan dalam pengambilan keputusan untuk pengembangan karyawan seperti promosi, training, dan sebagainya.Selain itu, hal ini juga berguna dalam penelitian yang dilakukan HR atau sebagai dasar bagi aktivitas pengembangan diri. Akan tetapi, clients served tidak dapat diharapkan untuk mengidentifikasikan secara keseluruhan dengan objektivitas organisasi. Jadi, setiap sumber memiliki penilaiannya sendiri dan menghasilkan perspektif yang berbeda. Hal ini dapat dilihat dalam tabel berikut :
Use
Source
Supervisor
Peers
subordinates
Self
Clients served
Employeement decisionts
x
x


X
Self-Development
x
x
x
x
X
Employment Research
x
x


X

5.6.The Multi-Trait-Multi-Rater Approach
Lawler (1967) mengatakan bahwa untuk menilai derajat persetujuan inter-rater dalam dimensi rating (validitas konvergen) dan untuk menilai kemampuan dari raters untuk membuat perbedaan dalam performa semua dimensi (validitas diskriminan), sebuah matriks listing dimension sebagai baris/deret dan raters sebagai kolom harus dipersiapkan. Multiple Rater untuk individu yang sama dapat digambarkan dari tingkat organisasi yang berbeda, dan mereka mungkin mengamati faset yang berbeda dari performansi pekerjaan orang yang dinilai. Karenanya, hal tersebut bisa jadi salah/keliru.
Sebagai aternatif, hybrid multi-trait-multi-rater dapat digunakan, dimana rater hanya membuat evaluasi pada dimensi yang benar-benar cocok untuk dinilai (Borman, 1974). Metode ini merupakan konsep yang cocok untuk menganalisis penilaian performansi, dan memiliki validitas konvergen dan diskriminan yang lebih tinggi dari pada dengan menggunakan analisis multi-trait-multi-rater.
6.      JUDGEMENTAL BIASES IN RATING
Dalam pandangan tradisional, judgemental bias diakibatkan oleh beberapa kesalahan pengukuran di pihak rater (penilai). Dengan demikian, mereka lebih mudah ditangani daripada kesalahan yang non sistematis atau random. Namun, setiap jenis bias telah didefinisikan dan diukur dengan cara yang berbeda dalam literatur. Menurut para manager, judgemental bias bukanlah suatu eror. Tetapi lebih mengarah pada kebijakan mereka untuk memanage orang secara efektif.
6.1.Leniency and Severity
Penggunaan ratings bersandar pada asumsi bahwa manusia memiliki ketelitian dan objektivitas yang cukup baik dalam melakukan observasi.Rating tersebut dilakukan untuk memperoleh aspek tertentu secara akurat dari  orang yang dinilai. Dalam asumsi ini, objektivity yang menjadi kendala utama. Raters menilai dengan asumsi yang dimilikinya sendiri (bisa jadi valid atau tidak) sedangkan sebagian besar orang-orang telah berhadapan dengan raters yang yang tampaknya mudah (toleran) dan susah (keras).
Bias leniency dan severity dapat dikendalikan atau dihilangkan dengan beberapa cara, yaitu:
a.       Mengalokasikan penilaian ke dalam distribusi yang ketat, dimana orang yang dinilai dibagi secara adil ke dalam distribusi normal.
b.      Mewajibkan supervisor untuk member peringkat pada bawahannya.
6.2.Central Tendency
Ketika menggunakan pertimbangan politik, penilai mungkin menetapkan semua nilai bawahannya yang sangat baik dan sangat buruk. Mereka mencegah untuk menggunakan skala penilaian yang ekstrim tinggi dan ekstrim rendah dan lebih cenderung mengelompokkan seluruh penilaian di tengah-tengah skala. Hal ini dapat mengurangi keakuratan dalam penilaian. Konsekuensinya adalah, sebagian besar nilai dari penilaian performansi sistematis hilang. Penilaian tersebut gagal untuk memisahkan keseluruhan atau antar individu, dan penilaian tersebut menjadi tidak berguna sebagai alat dalam pengambilan keputusan manajerial, seperti prediktor, kriteria atau feedback. Bias central tendensi dapat diminimalisir dengan cara menetapkan dengan jelas maksud dari berbagai tanda atau penilaian.
6.3.Halo
Halo bias merupakan bias yang paling sering muncul dalam penilaian kinerja. Seseorang dinilai baik tinggi atau rendah pada faktor-faktor tertentu karena kesan umum si penilai tersebut (baik-buruk). Berdasarkan teori ini, rater gagal dalam membedakan tingkat kinerja pada dimensi kinerja yang berbeda.
Tinjauan kritis dari penelitian mengenai bias ini (Murphy, Jako, and Anhalt, 1993) mengemukakan tiga kesimpulan, yaitu:
a.       Halo tidak biasa seperti yang kebanyakan dipercaya.
b.      Adanya halo tidak selalu mengurangi kualitas rating.
c.       Tidak mungkin untuk memisahkan yang sebenarnya dari efek halo di sebagian besar keadaan.
Sebuah penelitian menemukan bahwa penilaian yang dilakukan secara berkelompok lebih efektif dari pada individual, tetapi kelompok juga menunjukkan bias respon yang lebih besar. Oleh karena itu, kelompok dapat membantu tetapi mereka tidak dapat menghilangkan masalah bias tersebut.

7.      TYPES OF PERFORMANCE MEASURES
7.1.Objective Measures
Ukuran kinerja objektif meliputi data produksi (volume penjualan dolar, unit yang diproduksi, jumlah kesalahan, jumlah skrap) serta data kerja (kecelakaan, turnover, absen, keterlambatan).Variabel-variabel ini secara langsung menentukan tujuan organisasi dan sering mengalami beberapa kelemahan, dan yang paling derius adalah tidak reliabel dan modifikasi kinerja oleh karakteristik situasional.Pengukuran objektif tidak fokus pada perilaku, tetapi lebih pada hasil atau hasil perilaku. Namun, telah diakui bahwa akan ada beberapa tumpang tindih antara perilaku dan hasil, tetapi keduanya berbeda secara kualitatif.
Walaupun ukuran objektif pada performansi secara naluriah menarik, keterbatasan teoritis dan praktis sering membuat hal itu tidak cocok. Meskipun berguna bila dipakai untuk penilaian pengawasan, korelasi antara ukuran objektif dan subjektif sering rendah. Ketika digunakan sebagai dasar untuk keputusan kerja, kombinasi dari langkah-langkah tersebut memiliki pertimbangan berbeda untuk kelompok-kelompok etnis yang berbeda.
7.2.Subjective Measure
Kekurangan dari pengukuran objektif membuat para peneliti dan manajer untuk fokus pada penilaian subjektif dalam kinerja kerja. Namun, karena pengukuran subjektif tergantung pada human judgement, hal itu rentan terkena bias. Sehingga harus didasarkan pada analisis yang cermat dari perilaku yang diamati agar penilaian efektif.
Ada beberapa variasi dalam jenis ukuran kinerja subjektif yang digunakan oleh organisasi. Beberapa menggunakan daftar skala penilaian yang panjang dan rumit sedangkan yang lain hanya menggunakan skala sederhana dan lainnya juga memerlukan manajer untuk menulis satu atau dua paragraph tentang kinerja masing-masing bawahannya. Selain itu, ukuran subjektif dapat relative (di mana perbandingan dibuat di antara sekelompok ratees) atau absolute (di mana rate dijelaskan tanpa referensi kepada orang lain).

8.      RATING SYSTEMS : RELATIVE AND ABSOLUTE
Dalam taksonomi ini, beberapa metode berikut dapat dibedakan menjadi:
Relative
Absolute
Rank order
Essays
Paired comparisons
Behavior checklists
Forced distribution
Critical incidents
Graphic rating scales

8.1.Relative Rating Systems (Employee Comparisons)
Simple ranking adalah metode yang mengharuskan rater mengurutkan semua ratees dari urutan yang tertinggi sampai urutan yang terendah, dari "karyawan terbaik" sampai "karyawan terburuk". Alternation ranking mengharuskan rater menuliskan semua ratees di selembar kertas, kemudian rater memilih ratee terbaik (#1), lalu ratee terburuk (#n), kemudian kedua terbaik (#2), lalu kedua terburuk (#n-1), dan seterusnya, bergantian dari bagian atas sampai ke bagian bawah daftar sampai semua ratees selesai diranking. Baik simple ranking maupun alternation ranking secara tidak langsung membutuhkan rater untuk membandingkan tiap ratee dengan ratee lainnya,, tapi sistematika perbandingan ratee-to-ratee tidak dibuat untuk metode ini. Untuk hal ini kita memerlukan paired comparisons. Jumlah pasangan ratees yang akan dibandingkan dapat dihitung dengan rumus [n(n-1)]/2. Jika jumlah individu yang dibandingkan adalah 10 orang, [10(9)]/2 atau 45 perbandingan akan diperlukan. Tugas rater disini secara sederhana adalah memilih yang terbaik dari setiap pasangan. Dan peringkat masing-masing individu ditentukan dengan menghitung berapa kali mereka dinilai unggul.
Employee comparison methods mudah untuk dijelaskan dan dapat membantu dalam membuat keputusan kerja. Mereka juga menyediakan kriteria data yang berguna dalam studi validasi karena mereka memiliki kontrol yang baik terhadap leniency, severity, dan central tendency. Namun, seperti sistem yang lainnya, metode ini juga memiliki beberapa kelemahan yang harus dikenali. Biasanya karyawan hanya dibandingkan , atas satu kategori yang cocok secara keseluruhan.  Karena itu, ranking tidak memiliki kekhususan perilaku dan bisa melanggar hukum. Selain itu, employee comparison hanya menghasilkan data ordinal--data yang tidak memberikan indikasi jarak relatif antara individu. Pada umumnya tidak mungkin membandingkan ranking antar grup, departemen, atau lokasi. Dua masalah terakhir dapat diatasi dengan mengubah ranking menjadi nilai standard yang telah di normalisasikan, yang kemudian membentuk distribusi mendekati normal.
Masalah selanjutnya berasal dari kecenderungan employee comparison methods untuk memberikan reward kepada anggota kelompok inferior dan menghukum anggota kelompok superior. Reliabilitas akan dipertanyakan ketika diminta untuk meranking ulang semua individu di kemudian hari, namun Peringkat tinggi dan rendah  mungkin saja tetap stabil, tapi peringkat yang ditengah berkemungkinan berubah. Metode employee comparison yang terakhir adalah forced distribution. Forced distribution memiliki keuntungan utama  yaitu ia mengontrol  leniency, severity, dan central tendency bias lebih efektif. Walaupuin begitu, hal ini kemungkinan menyebabkan ratee akan menyesuaikan diri dengan distribusi normal, dan hal ini dapat mengarahkan ke eror yang lebih besar jika kelompok ratee , sebagai kelompok, menjadi baik itu unggul atau dibawah standar. Singkatnya, daripada menghilangkan eror , forced distribution malah mengarahkan kita ke eror jenis lainnya.


8.2.Absolute Rating Systems
Absolute rating system memungkinkan seorang rater untuk mendeskrisikan ratee tanpa membuat referensi langsung untuk ratee lainnya. Mungkin absolute rating systems yang paling sederhana adalah narrative essay, dimana rater diminta untuk mendeskripsikan, secara lisan, kelebihan individu, kelemahan, dan potensi, dan membuat saran untuk perbaikan. Asumsi yang mendasari pendekatan ini adalah bahwa pernyataan jujur dari seorang rater yang berpengetahuan luas terhadap kinerja ratee sama validnya dengan metode penilaian yang lebih formal dan lebih rumit.
Keuntungan dari narrative essay (ketika dilakukan dengan tepat) adalah dapat memberikan feedback secara detail kepada ratee mengenai performa mereka. Di sisi lain, essai hampir sepenuhnya tidak terstruktur, dan memiliki panjang dan isi yang bervariasi. Perbandingan antar individu, kelompok, atau departemen hampir tidak mungkin dilakukan karena setiap essai menyentuh aspek yang berbeda dari setiap kinerja ratee atau kualifikasi personal mereka. Pada akhirnya, essai hanya memberikan informasi kualitatif saja, namun agar penilaian dapat mencakup kriteria atau agar dapat dibandingkan secara obyektif dan diranking untuk tujuan keputusan kerja, beberapa bentuk penilaian yang kuantitatif merupakan hal yang penting. Behavioral checklist menyediakan satu skema seperti itu.
Behavioral Checklists
Behavioral checklist yang diberikan pada rater berisi serangkaian pernyataan deskriptif perilaku yang berhubungan dengan pekerjaan. Dalam pendekatan ini rater tidak begitu banyak mengevaluasi karena mereka hanya ditugaskan untuk melaporkan perilaku kinerja ratee. Selain itu, penilaian deskripsi memiliki reliabilitas yang lebih tinggi dibandingkan penilaian evaluative (Stockford&Bissell,1949).
Item checklist dapat digunakan untuk membuat skala sikap. Salah satu metodenya dalah Likert of summated ratings, (misalnya, dia melakukan beberapa strategi pada penjualannya) diikuti beberapa kategori respon seperti “selalu”, “sangat sering”, “sering”, “jarang” dan “tidak pernah”. Rater hanya memeriksa kategori respon yang dia rasa menggambarkan ratee. Beberapa bobot kategori respon, 5 (sering) dan 1 (tidak pernah) jika penyataan menggambarkan perilaku yang diinginkan atau sebaliknya. Keseluruhan penilaian numeric untuk beberapa individu kemudian didapatkan dari bobot yang dijumlahkan dari respon yang diperiksa untuk beberapa item, dan skor untuk dimensi performa dapat diperoleh menggunakan prosedur analisis item (Anastasi, 1988).
Penyeleksian dari kategori respon untuk skala penilaian sering dibuat dengan interval yang sama antara poin skala yang diasumsikan. Daftar skala dari perubahan keterangan frekuensi dan penjumlahan yang secara statistik yang optimal dari 4 sampai 9 pada poin skala (Bass, Cascio, dan O’Connor, 1974). Nilai skala juga tersedia untuk kategori persetujuan, evaluasi, dan frekuensi (Spector, 1976). Checklist mudah digunakan dan dimengerti, tetapi terkadang memberikan kesulitan untuk rater dalam memberi diagnostic feedback yang didasarkan pada checklist ratings, karena tidak memberikan bentuk perilaku yang spesifik. Namun, keuntungan yang mungkin dari checklist adalah dapat menggambarkan keseluruhan populasi yang dalam sebuah organisasi.
Forced-Choice Systems
Salah satu jenis behavioral checklist adalah forced choice system, sebuah teknik yang dikembangkan dengan spesifik untuk mengurangi kesalahan dan menentukan standar yang objektif dari setiap perbandingan antarindividu (Sisson, 1948). Checklist statements biasanya disusun dalam bentuk kelompok, dimana rater memilih pernyataan yang sebagian besar atau setidaknya dapat mendeskripsikan ratee tersebut. Rating keseluruhan (skor) untuk setiap individu kemudian diperoleh dengan skor yang telah ditetapkan untuk mendeskripsikan ratee.
Forced-choice scales dibentuk berdasarkan dua bentuk statistik dari checklist aitem: 1. Discriminability; mengukur tingkat perbedaan item dari pekerja yang efektif sampai yang tidak efektif, 2. Preference, derajat indeks dari kualitas yang dinyatakan dalam bentul item yang dinilai (misalnya socially desirable) oleh orang-orang. Dasar pemikiran dari forced-choice system ini mengharuskan item berpasangan agar seimbang. Secara teoritis, dalam memilih item tunggal yang akan dipasangkan seharusnya dibeda-bedakan berdasarkan pada kekuatan item, bukan berdasarkan social desirability.
Misalnya, mempertimbangkan pasangan item:
1.      Memisahkan pendapat dari fakta dalam laporan tertulis.
2.      Termasuk informasi yang relevan dengan yang dituliskan dalam laporan.
Kedua penyataan tersebut kira-kira sama, tapi hanya item (1) yang ditemukan untuk membedakan efektif dari pekerja yang tidak efektif dalam depertemen kepolisian. Ini mendefinisikan karakteristik teknik forced-choice: tidak semua pernyataan perilaku yang menarik sama validnya
Keuntungan utama dari forced-choice scales adalah rater tidak dapat memanipulasi jumlah nilai individu yang tinggi atau rendah, karena mereka tidak mengetahui pernyataan yang mewakili nilai tersebut. Sedangkan kerugiannya adalah rater resistance. Kontrol yang hilang dari rater, yang merasa tidak yakin pada penilaian subordinate (dan bahkan mungkin memiliki efek negatif) dalam wawancara penilaian kinerja, untuk rater yang tidak menyadari nilai-nilai dari skala item yang dipilihnya. Kerjasama dan penerimaan rater merupakan penentu penting dari keberhasilan setiap sistem penilaian, forced-chooice systems cenderung menjadi pilihan yang tidak populer di banyak organisasi.
Crittical Incidents
Metode ini pada penilaian performa telah menghasilkan banyak kepentingan dalam beberapa tahun terakhir dan beberapa variasi ide dasar yang saat ini digunakan. Flanagan (1954) membuat perbedaan antara membuat suatu pekerjaan secara efektif dan melakukannya dengan efektif. Critical incident hanya dilaporkan oleh observer yang berpengetahuan mengenai karyawan yang sangat efektif atau tidak efektif dalam menyelesaikan pekerjaan mereka. Critical incident dicatat ketika terjadi untuk setiap karyawan oleh atasannya. Mereka menilai kinerja berbasiskan perilaku, misalnya dalam observasi seorang petugas polisi yang mengejar perampok bersenjata yang diduga menyusuri jalan, seorang atasan mencatat:
“22 juni, petugas Mitchell ditahan dalam situasi menggunakan senjata, dimana tembakan akan membahayakan saksi yang tidak bersalah.”
Metode critical incident terlihat alami dalam wawancara penilaian kinerja karena atasan bisa fokus pada perilaku pekerjaan yang sebenarnya bukan pada trait. Retee menerima feedback dan mereka dapat melihat perubahan dalam perilaku kerja mereka agar mereka dapat mengetahui apa yang bisa dilakukan untuk meningkatkan performa kerja Selain itu, ketika sejumlah besar critical incident dikumpulkan, diabstrakan, dan dikategorikan, mereka dapat memberikan informasi yang mendalam mengenai pekerjaan dan masalah organisasi secara umum dan sangat cocok untuk menetapkan tujuan program pelatihan (Flanagan dan Burns, 1995 ). Metode critical incident juga memilki kelemahan, memakan waktu yang lama kepada supervisor untuk mencatat kejadian untuk semua bawahannya dalam format perhari/perminggu.
Namun, dalam bentuk narasi mereka, insiden tidak mudah digunakan untuk kuantifikasi, seperti yang dikatakan sebelumnya, menimbulkan masalah dalam perbandingan antara-individu dan antara kelompok serta analisis statistik. Untuk alasan ini dua variasi dari gagasan original telah disarankan. Kirchner dan Dunnette (1957b), misalnya, menggunakan metode untuk mengembangkan behavioral checklist (menggunakan metode penilaian yang dijumlahkan) untuk merating performansi sales. Setelah insiden yang disarikan dan diklasifikasikan, item yang dipilih kemudian dirancang menjadi checklist, misalnya,
Gives good service on costumers complaints
Strongly       Agree       Undecided       Disagree       Strongly
agree                                                                              disagree
Modifikasi kedua yang merupakan pengembangan dari skala penilaian berdasarkan perilaku, pendekatan yang akan dibahas pada bagian berikutnya.
Graphic Rating Scales
Graphic rating scale adalah salah satu metode penilaian performa yang mungkin lebih banyak digunakan. yang mana contohnya dapat di lihat pada Figure 5-4. Yang dibedakan dalam 3 hal:
1.      Sejauh mana arti dari kategori respon yang dapat di defenisikan.
2.      Sejauh mana individu yang menginterpretasikan penilaian (seorang HR manager) dapat mengatakan secara jelas respon apa yang dimaksudkan.
3.      Sejauh mana dimensi performa yang dinilai didefinisikan untuk penilai.
Sebuah graphic rating scale memiliki poin yang digambarkan secara kontinum. Oleh karena itu, Dalam urutan membuat pembedaan dalam dimensi performa, poin skala harus digambarkan secara tidak ambigu untuk rater, proses ini disebut anchoring. Skala  a  menggunakan anchor kualitatif saja. Skala b termasuk numerical dan verbal anchor, sedangkan skala c, d, dan f menggunakan menggunakan anchor lisan. Tinggi atau rendahnya kualitas ditentukan penilai. Skala e lebih baik menjelaskan kualitas dalam konteks tertentu. Skala berbeda dalam hal definisi dimensi kinerja. Skala a dan c hampir tidak menjelaskan definisi kualitas, skala b menggabungkan kuantitas dan kualitas menjadi satu dimensi, dan skala d dan e mendefinisikan kualitas dalam hal yang berbeda sama sekali (yakni thoroughness, dependability, dan neatness vs accuracy, effectiveness, dan freedom from error). Skala f adalah peningkatan, sedangkan kualitas mewakili akurasi, efektivitas, inisiatif ( kombinasi definisi dari skala d dan e), setidaknya rating yang terpisah dibutuhkan di setiap aspek kualitas.
Gambar 5-4 adalah bagian dari skala penilaian grafis yang digunakan untuk me-rate perawat. Respons kategori yang jelas, individu menginterpretasikan apa tanggapan yang dimaksudkan penilai, dan dimensi kinerja didefinisikan bahwa penilai dan ratee memahami dan dapat menyetujui.
Skala penilaian grafis (1) sedikit memakan waktu dalam pengembangan dan pengelolaan, (2) memungkinkan hasil kuantitatif yang ditentukan, (3) mempertimbangkan lebih dari satu dimensi kinerja, dan (4) distandarisasi dan sebanding terhadap seluruh individu. Di sisi lain, skala penilaian grafis memberikan kontrol maksimal kepada penilai, dengan demikian tidak punya kendali atas leniency, severity, central tendency, atau halo. Karena alasan-alasan tersebut, hal ini dikritik. Namun, ketika skala penilaian grafis sederhana dibandingkan dengan forced-choice rating yang lebih canggih, skala grafis secara konsisten terbukti dapat diandalkan, valid (King et al., 1980) dan lebih diterima oleh penilai. (Bernardin dan Beatty, 1984).
Behaviorally Anchored Rating scale (BARS)
Bagaimana skala penilaian grafis ditingkatkan? Menurut Smith dan Kendall (1963)
“Penilaian lebih baik dapat diperoleh, tidak melalui trik terhadap penilai, namun membantu mereka untuk menilai.  Kita dapat memberikan pertanyaan yang dapat dijawab secara jujur mengenai perilaku yang dapat diamati. Kita juga harus meyakinkan mereka bahwa jawaban tidak akan disalahpahami serta menyediakan dasar dimana dia dan yang lain dapat memeriksa jawabannya.”
Prosedurnya adalah berikut. Pada awal pertemuan, sekumpulan pekerja dan atau pengawas berusaha untuk mengenali dan menjelaskan semua dimensi yang penting dari performa yang efektif dari tugas yang khusus., Grup yang kedua kemudian menghasilkan , untuk setiap dimensi peristiwa kritis yang menggambarkan performa yang efektif, rata-rata dan tidak efektif. Grup yang ketiga kemudian diberi daftar dimensi dan pengertiannya, selama daftar yang acak dari peristiwa kritis yang dihasilkan  oleh grup ke dua. Tugas mereka adalah menyingkat atau menempatkan peristiwa kedalam dimensi yang mereka wakili paling baik.
Prosedur ini dikenal dengan retranslasi sejak hal ini mirip dengan pemeriksaan kendali kualitas yang digunakan untuk memastikan kecukupan penerjemahan dari satu bahasa ke bahasa lain. Materinya diterjemahkan kedalam bahasa asing dan  diterjemahkan ulang ke bentuk aslinya dengan penterjemah yang independen.
Dalam konteks penilaian performa,  prosedur ini memastikan bahwa pemahaman kedua dimensi kerja dan peristiwa perilaku dipilih untuk menggambarkan hal yang spesifikdan jelas. Peristiwa dieliminasi  tergantung pada dimana dimensi berada. Sebaliknya dimensi mungkin ditambahkan jika banyak peristiwa dialokasikan pada kategori yang lain.
9.      SUMMARY COMMENTS ON RATING FORMATS AND RATING PROCESS
Bagi jutaan pekerja saat ini  khususnya yang bergerak di asuransi , telekomunikasi, transportasi dan industry perbankan sedang diawasi oleh computer selambekerja adalah fakta kehidupan.
Dalam kebanyakan pekerjaan , penilaian pada manusia mengenai performa kerja individual adalah hal yang pasti, Tak masalah format mana yang digunakan. Ini adalah masalah terbesar dengan semua format.
Terkecuali pengamatan terhadap orang yang dinilai ekstensif dan representative, hal ini tidak mungkin dalam penilaian untuk menggambarkan performa yang nyata dari yang dinilai, lalu, penilai juga membuat kesimpulan mengenai performa, penilaian subjek terhadap semua bias yang terhubung dengan skala penilaian. Penilai bebas untuk merusak penilaian untuk menyesuaikan dengan tujuannya. Hal ini dapat membatalkan semua kerja sungguh-sungguh yang mengarah pada skala skala dan mungkin menjelaskan kenapa tak ada format penilaian tunggal yang ditampilkan superior terhadap yang lain.
Banks dan Robinson menyarankan 2 strategi : Pertama, Bangun sebanyak mungkin struktur agar meminimalkan keleluasaan yang diuji oleh penilai. Kedua, Jangan syaratkan penilai untuk membuat penilaian  yang mereka tidak kompeten dalam hal tersebut.
10.  FACTORS AFFECTING SUBJECTIVE APPRAISALS
Penilaian kinerja merupakan suatu proses yang kompleks yang dapat dipengaruhi oleh berbagai macam faktor, seperti organisasi, politik, dan hambatan interpersonal. Dalam hal rating ada beberapa faktor yang mungkin berpengaruh, seperti perbedaan individual pada rater dan ratee, serta interaksi antara rater dan ratee. Berikut beberapa karakterikstik rater, ratee, dan interaksi antara rater dan ratee yang berpengaruh dalam rating kinerja (untuk informasi lebih lanjut, perhatikan tabel 5-3, 5-4, 5-5 dalam Cascio, 1998).
Karakteriktik
Rater
Ratee
Interaksi antara Rater dan Ratee
Gender
Tidak memiliki efek umum
Wanita mendapat rating lebih rendah ketika bekerja kurang dari 20 persen dalam kelompok dan mendapat rating lebih tinggi ketika mencapai 50 persen
Dalam imbalan dan promosi, wanita memperoleh rating bias negatif oleh rater yang memiliki stereotipe tentang wanita
Tingkat kinerja
Performer yang efektif akan menghasilkan rating yang reliabel dan valid
Tingkat kinerja dan kemampuan aktual menimbulkan efek terbesar dalam rating

Pengetahuan tentang ratee dan pekerjaan
Rating kurang akurat apabila memiliki sedikit data


Prior expectations
Ketidaksesuaian harapan rater menghasilkan rating yang lebih rendah
Informasi awal dapat menimbulkan bias
Rating menilai perilaku tampak


Stres
Rater yang stres cenderung membuat penilaian berdasarkan kesan pertama



Dari tabel di atas, dapat diketahui efek dari perbedaan individu dalam rating kinerja. Hal ini dapat menjelaskan mengapa reliabilitas, perubahan, dan konsistensi terjadi dalam rating. Selain itu, informasi di atas juga dapat menjelaskan sebab terjadinya bias dan pemrosesan informasi yang digunakan rater dalam mengevaluasi data. Dengan demikian, informasi yang diperoleh dapat digunakan untuk memperbaharui konten pada pelatihan rater sehingga menghasilkan penilaian yang berkualitas.
11.  RATER TRAINING
Langkah awal dalam merancang suatu pelatihan adalah menspesifikkan tujuan. Dalam pelatihan rater ada tiga tujuan, yaitu :
a.       Meningkatkan kemampuan obsevasi rater terkait “apa” yang harus diperhatikan
b.      Mengurangi atau menghilangkan penilaian yang bias
c.       Meningkatkan kemampuan rater untuk mengkomunikasikan informasi penilaian secara objektif kepada ratee.
Dari berbagai macam pelatihan rater, peneliti menganggap bahwa frame-of-reference training adalah yang paling efektif dalam meningkatkan keakuratan penilaian kinerja. Berikut merupakan prosedur pelatihan yang dikembangkan oleh Pulakos (Cascio, 1998).
1.      Partisipan diminta mengevaluasi tiga ratee dalam tiga dimensi kinerja yang terpisah.
2.      Partisipan diberi skala rating dan diminta untuk membaca definisi dimensi dan skala dengan kuat seperti yang dicontohkan trainer.
3.      Trainer mendiskusikan perilaku ratee yang diilustrasikan dalam level performa yang berbeda pada tiap skala yang bertujuan agar rater membuat suatu kesepakatan terkait dimensi performa dan level yang tepat untuk perilaku yang berbeda.
4.      Partisipan ditunjukkan video praktikum dan diminta untuk mengevaluasi manajer yang menggunakan skala.
5.      Partisipan menulis dan mendiskusikan hasil evaluasi atau rating yang telah dibuat. Trainer mengindentifikasi perilaku partisipan dalam memutuskan rating dan mengklarifikasi perbedaan dalam rating.
6.      Trainer memberikan feedback pada partisipan.
Frame-of-reference training menyediakan skema yang membantu rater dalam memproses informasi terkait kinerja. Skema ini akan membantu dalam encoding, penyimpanan, dan retrival dari penilaian performa. Penggunaan nilai dalam performa dan feedback selama training membantu rater untuk belajar langsung dan mengetahui penggunaan standar rating. Dengan demikian, frame-of-reference training merupakan suatu contoh dari proses dimana standar dimensi performa diperoleh sehingga meningkatkan keakuratan dalam rating.
11.1.        The Wider Context of Performanca Appraisal
Isu terkait sikap dan perilaku merupakan hal yang ditekankan dalam penilaian kinerja, namun format instrumen atau rating yang digunakan masih memiliki keterbatasan dalam penskoran kinerja.
Ada tiga penelitian yang mengukur implikasi dari sistem penilaian kinerja, yaitu sebagai berikut.
a.       Penelitian Ivanveich (1980), terkait  dampak jangka panjang dari penggunaan BARS dalam organisasi. Pada tiga titik pengukuran selama 20 bulan, diperoleh hasil bahwa 121 teknisi yang diukur dengan BARS melaporkan sikap yang lebih baik terhadap sistem dan berkurangnya tension kerja dibanding yang diukur dengan trait-oriented scale. Namun, penelitian ini tidak mengunakan true control group design sehingga tidak dapat dikatakan bahwa sistem BARS yang menyebabkan peningkatan pada teknisi.
b.      Penelitian Mount (1983), yang mensurvei 612 manajer dan 1.550 karyawan dalam sebuah perusahaan multinasional untuk mengukur kepuasan terhadap sistem baru penilaian kinerja. Hasil yang diperoleh menunjukkan bahwa kepuasan berbeda tergantung pada perspektif individu. Manajer menilai bahwa sistem menampilkan komponen yang berbeda dibanding apa yang dilakukan karyawan. Manajer juga mengganggap bahwa item yang ada menyinggung aturan perusahaan dan prosedur penilaian yang berbeda. Sedangkan karyawan mempersepsikan aspek dari sistem secara global. Kepuasan karyawan diukur dari pengalaman terhadap sistem, kualitas diskusi penilaian, bagaimana sistem dapat mendiskusikan dan menyusun rencana perkembangan selanjutnya.
c.       Penelitian Hogan (1987), terkait dampak dari harapan awal dalam rating. Hasil yang diperoleh adalah ketidakcocokan antara harapan awal dan kinerja sebenarnya mempengaruhi penilaian. Ketika kinerja sebenarnya lebih rendah dari harapan awal, rating yang diperoleh akan lebih rendah dibanding performa sebenarnya.

12.  INFORMATION FEEDBACK: APPRAISAL AND GOAL-SETTING INTERVIEWS
Salah satu tujuan utama dari performance appraisal adalah berfungsi sebagai pengembangan personal/pribadi, dalam rangka memperbaiki, harus ada beberapa umpan balik dari kinerja. Efek umpan balik atas kinerja masa depan ini telah didokumentasikan dengan baik (Ilgen, Fisher, dan Taylor, 1979; Ilgen and Moore, 1987). Memang, penelitian menunjukkan bahwa manajer juga harus mencari kinerja yang negatif dari karyawan, tidak hanya yang positif saja, umpan balik yang diberikan dapat dari berbagai sumber (atasan, teman sejabatan, dan bawahan). Melakukan hal tersebut menghasilkan dua hal, yaitu: (1) akurat dalam mendeteksi masalah kinerja, dan (2) dapat menghasilkan sistem penilaian  yang baik dari berbagai sumber umpan balik (Ashford dan Tsui, 1991). Tanggung jawab untuk berkomunikasi seperti umpan balik dari berbagai sumber ini dilakukan dengan wawancara penilaian kinerja oleh atasan langsung (Ghorpade dan Chen, 1995).
Idealnya, proses umpan balik yang berkelanjutan harus ada di antara atasan dan bawahan, sehingga keduanya dapat petunjuk. Namun, dalam prakteknya, supervisor sering "menyimpan" informasi yang berkaitan dengan kinerja untuk wawancara penilaian formal, pelaksanaan yang merupakan pengalaman yang sangat melelahkan untuk kedua belah pihak. Kebanyakan supervisor menolak "playing God" (memainkan peran hakim) dan kemudian mengkomunikasikan penilaian mereka kepada bawahan (McGregor, 1957). Oleh karena itu, supervisor dapat menghindari menghadapi masalah tidak nyaman, tetapi jika masalah tersebut terjadi, bawahan cenderung akan menolak atau merasionalisasikan mereka dalam upaya untuk mempertahankan harga diri (Larson, 1989). Dengan demikian, proses ini merugikan diri sendiri bagi kedua belah pihak. Untungnya kebutuhan ini tidak selalu terjadi. Berdasarkan temuan dari penelitian wawancara penilaian, tabel 5-6 menyajikan beberapa kegiatan yang supervisor harus terlibat dalam sebelum, selama, dan setelah wawancara penilaian. Mari secara singkat kita mempertimbangkan masing-masing.
Frequent Communication. Dua hasil yang paling jelas dari penelitian tentang wawancara penilaian adalah, bahwa sekali setahun penilaian kinerja adalah nilai yang dipertanyakan, dan pembinaan yang harus dilakukan lebih sering khususnya bagi yang berkinerja buruk atau dengan karyawan baru (Cederblom, 1982; Meyer, 1991). Umpan balik memiliki pengaruh yang maksimal ketika diberikan sedekat mungkin dengan tindakan. Jika seorang bawahan bertindak efektif katakan segera, jika ia bersikap tidak efektif, juga katakan segera.
Appraisal Training. Seperti yang kita catat sebelumnya, peningkatan penekanan harus ditempatkan pada penilai pelatihan untuk mengamati, perilaku yang lebih akurat dan adil dibandingkan pada penyediaan perilaku ilustrasi spesifik "bagaimana" atau "tidak bagaimana" tingkat. manajer pelatihan untuk memberikan informasi evaluatif dan memberikan umpan balik. Pelatihan manajer untuk memberikan informasi evaluatif dan memberikan umpan balik harus difokuskan pada karakteristik manajerial yang sulit untuk dinilai dan karakteristik yang orang kira mudah untuk dinilai tapi hal itulah yang biasanya menyebabkan perselisihan. Seperti faktor pengambilan risiko dan pengembangan bawahan (Wohler dan London, 1989).
Judge Your Own Performance First. Kita seringkali menggunakan norma atau standart kita sendiri dalam menilai orang lain. Meskipun kecenderungan ini sulit untuk diatasi, temuan penelitian di bidang persepsi interpersonal dapat membantu meningkatkan proses, yaitu:
1.    Mekanisme perlindungan diri seperti penyangkalan, menyerah, promosi diri, dan takut gagal memiliki pengaruh negatif terhadap kesadaran diri.
2.    Mengetahui diri sendiri membuat lebih mudah untuk melihat orang lain secara akurat dan kemampuan manajerial itu sendiri.
3.    Mengenal karakteristik sendiri akan mempengaruhi cara pandang terhadap karakteristik orang lain.
4.    Orang yang menerima dirinya lebih mungkin untuk dapat melihat aspek yang menguntungkan orang lain.
5.    Akurat dalam memahami orang lain bukan keterampilan tunggal (Wohlers and London, 1989; Zalkind and Costello, 1962).
Encourage Subordinate Preparation. Penelitian yang dilakukan di sebuah rumah sakit besar di Midwest menunjukkan bahwa semakin banyak waktu yang dihabiskan karyawan untuk wawancara penilaian menganalisis tugas pekerjaan dan tanggung jawab, masalah yang dihadapi di tempat kerja. dan lolos dari kinerja mereka, semakin besar kemungkinan mereka harus puas dengan proses penilaian, termotivasi untuk meningkatkan kinerja mereka, dan benar-benar untuk meningkatkan kinerja mereka sendiri, dan benar-benar untuk meningkatkan kinerja mereka (Burke, Weitzel, dan Weir, 1978). Hal-hal yang dapat dilakukan untuk persiapan yaitu: (1) Bentuk BARS bisa dikembangkan untuk tujuan ini dan bawahan dapat didorong atau diwajibkan untuk menggunakannya (Silverman dan Wexley, 1984). (2) Karyawan dapat diberikan  wawancara penilaian sebelumnya. (3) Karyawan dapat didorong atau diminta untuk menilai kinerja mereka sendiri berdasarkan kriteria atau bentuk yang sama yang digunakan pleh supervisor (Farth, Werbel, dan Bedeian, 1988).
Self-review memiliki setidaknya empat keuntungan: (1) Meningkatkan martabat dan kehormatan diri bawahan; (2) Menempatkan peran manajer sebagai konselor, bukan hakim; (3) Dapat merumuskan rencana atau tujuan selama diskusi untuk mempromosikan karyawan; (4) Lebih memuaskan dan produktif bagi kedua belah pihak daripada sekedar review manajer ke bawahan tradisional (Meyer, 1991).
          Warm Up and Encourage Participation. Penelitian menunjukkan bahwa pada umumnya bawahan merasa dia berpartisipasi dalam wawancara dengan menyajikan gagasan-gagasan dan perasaannya, bawahan merasa bahwa supervisor itu membantu dan konstruktif, bahwa beberapa masalah pekerjaan dapat dibersihkan, dan bahwa tujuan di masa yang akan datang telah ditetapkan. Namun, kesimpulan yang benar selama wawancara penilaian merupakan ancaman yang rendah untuk bawahan karena bawahan tersebut sebelumnya telah menerima wawancara penilaian dari atasan, dia terbiasa untuk berpartisipasi dan dia memiliki pengetahuan tentang isu-isu yang akan dibahas dalam wawancara (Cederblom, 1982).
          Judge Performance, not Personality. Lebih banyak pengawas fokus pada kepribadian dan tingkah laku dari bawahan mereka dibandingkan aspek perilaku yang berkaitan dengan pekerjaan mereka, semakin rendah kepuasan antara atasan dan bawahan maka semakin kecil bawahan akan termotivasi untuk meningkatkan kinerjanya (Burke, dkk, 1978).
          Be Spesific. Wawancara penilaian lebih mungkin berhasil jika pengawas dianggap konstruktif dan membangun (Russell dan Goode, 1988). Dengan menjadi jelas dan spesifik, supervisor memberikan umpan balik yang sangat jelas kepada bawahan mengenai tindakan masa lalu. Supervisor dapat menunjukkan secara spesifik tentang perilaku positif maupun negatif pada pekerjaan. Data menunjukkan bahwa penerimaan dan keakuratan dari umpan balik oleh bawahan sangat dipengaruhi oleh urutan informasi yang positif atau negatif disajikan. Memulai wawancara penilaian dengan umpan balik yang positif  diasosiasikan dengan masalah kecil, yang dilanjutkan dengan membahas masalah besar. Pujian tentang aspek minor perilaku harus meletakkan individu nyaman, dan mengurangi efek blocking disfungsional yang terkait dengan kritik (Stone, Gueutal, dan McIntosh, 1984).
          Be an Active Listener. Pendengar yang aktif memperhatikan petunjuk-petunjuk verbal maupun petunjuk nonverbal, dan di atas semuanya mereka menerima apa yang orang lain katakan tanpa argumen atau kritik. Ancaman masing-masing individu dengan jumlah martabat yang sama dan rasa hormat yang menuntut diri kita sendiri.
          Avoid Destructive Criticism. Kritik yang merusak bersifat umum, bernada kasar, dan sering yang dikritik itu atribut kinerja yang buruk dikarenakan dari internal (misalnya, kurangnya motivasi atau kemampuan). Bukti menunjukkan bahwa karyawan cenderung mengatributkan masalah kinerja dikarenakan faktor-faktor di luar kendali mereka (misalnya, bahan yang tidak memadai, peralatan, instruksi, atau waktu) sebagai mekanisme untuk mempertahankan harga diri mereka (Larson, 1989). Tidak mengherankan, oleh karena itu, kritik yang merusak menyebabkan tiga konsekuensi: (1) Menghasilkan perasaan negatif di antara penerima dan dapat memulai atau meningkatkan konflik antara individu-individu, (2) Mengurangi preferensi penerima untuk menangani perselisihan di masa depan dengan memberi umpan balik secara damai (misalnya, kompromi, kolaborasi), dan (3) Memiliki efek negatif pada tujuan diri dan perasaan self-efficacy (Baron, 1988). Tak perlu dikatakan, ini adalah salah satu jenis komunikasi yang akan dilakukan manajer dan orang lain dengan baik untuk menghindarinya.
          Set Mutually Agreeable Goals. Ada tiga alasan terkait mengapa penetapan tujuan mempengaruhi kinerja. Pertama, memiliki efek direktif artinya memfokuskan kegiatan di satu arah tertentu lebih daripada yang lain. Kedua, mengingat bahwa tujuan diterima, orang cenderung mengerahkan usaha secara proporsional dengan kesulitan tujuan. Terakhir, tujuan yang sulit maka lebih tekun dalam mencapainya (yaitu, usaha diarahkan dari waktu ke waktu) daripada tujuan yang mudah. Ketiga dimensi, arah (pilihan), usaha, dan ketekunan, adalah pusat untuk motivasi/proses penilaian (Katzell, 1994; Latham dan Wexley, 1981).
          Continue to Communicate and Assess Progress Toward Goals Regularly. Ketika pembinaan adalah kegiatan sehari-hari, bukan ritual sekali setahun, wawancara penilaian dapat diletakkan dalam perspektif yang benar: Ini hanya memformalkan sebuah proses yang harus terjadi secara teratur pula. Hal ini dilakukan dengan tujuan membantu menjaga perilaku pada target, memberikan pemahaman yang lebih baik tentang alasan di balik pemberian tingkat kinerja, dan meningkatkan komitmen bawahan untuk kinerja yang efektif.
          Make Organizational Rewards Contingent on Performance. Hasil penelitian jelas dipotong pada masalah ini. Bawahan yang melihat hubungan antara hasil penilaian dan keputusan kerja lebih mungkin untuk mempersiapkan wawancara penilaian, lebih mungkin aktif untuk mengambil bagian di dalamnya, dan lebih mungkin puas dengan sistem penilaian (Burke et al., 1978). Manajer, pada gilirannya, akan mendapatkan hasil lebih besar dari sistem penilaian mereka dengan mengindahkan hasil ini.
          Kesimpulannya, kita sekarang memiliki banyak informasi berharga tentang proses penilaian yang dapat dan harus diterapkan dalam organisasi. Hal ini harus dibangun ke dalam program pelatihan pengawasan, dan harus dikomunikasikan kepada karyawan dalam upaya untuk membuat hidup mereka bekerja lebih memuaskan dan bermakna dan untuk meningkatkan kualitas kinerja organisasi secara keseluruhan.


DAFTAR PUSTAKA
Cascio, Wayne F. (1998). Applied Psychology in Human Resource Management, Fifth Edition. USA : Prentince Hall



0 komentar:

Posting Komentar