Teori permainan

Kategori umum
Ekonomi

Ekonomi menurut kawasan Afrika·Amerika Amerika Selatan·Asia Eropa·Oseania
Ekonomi mikro·Ekonomi makro Sejarah pemikiran ekonomi Metodologi·Pendekatan heterodoks
Bidang dan subbidang
Perilaku·Budaya·Evolusi Pertumbuhan·Pengembangan·Sejarah Internasional·Sistem ekonomi KeuangandanEkonomi keuangan MasyarakatdanEkonomi kesejahteraan Kesehatan·Buruh·Manajerial Bisnis Informasi·Informasi·Teori permainan Organisasi Industri·Hukum Pertanian·Sumber daya alam Lingkungan·Ekologis Geografi Ekonomi·Kota·Pedesaan·Kawasan Peta ekonomi
Teknik
Matematika· Ekonometrika Eksperimental·Neraca nasional
Daftar
Jurnal·Publikasi Kategori·Topik·Ekonom
Ideologi ekonomi Anarkisme·Kapitalisme Komunisme·Korporatisme Fasisme·Georgisme Islam·Globalisasi Ekonomi Pasar sosialisme·Merkantilisme Proteksionis·Sosialisme Sindikalisme·Jalan Ketiga
Perekonomian: Konsep dan Sejarah
Portal Bisnis dan ekonomi
Kotak ini: lihat bicara sunting

Teori permainan(bahasa Inggris:game theory) adalah bagian dari ilmumatematikayang mempelajari interaksi antar agen yang bersifat rasional. Setiap keputusan atau strategi yang dipilih oleh agen akan memiliki hasil yang berbeda (payoff) pada agen kompetitor^[1].Pertama kali dikembangkan sebagai cabang tersendiri dari ilmu matematika olehOskar MorgensterndanJohn von Neumann,cabang ilmu ini telah berkembang sedemikian pesat hingga melahirkan banyak tokoh peraih nobel, sepertiJohn Nash(AS),Reinhard Selten(Jerman), danJohn Harsanyi(AS) pada tahun1999danThomas Schelling(AS),Robert Aumann(Israel) pada tahun2005,danLeonid Hurwicz(Amerika Serikat) pada tahun 2007.

Dasar teori permainan

Permodelan teori permainan paling mudah biasanya dimodelkan dalam bentukmatrikspayoffatau pohon keputusan. Pada dasarnya, teori permainan diasumsikan semua agen bersifat rasional. Rasionalitas yang dimaksud adalah dimana setiap agen diasumsikan memutuskan strategi untuk memaksimalkanpayoffdari agen itu sendiri yang tergantung pada pengetahuan dari agen terhadap strategi kompetitor^[2].Variabel-variabel yang diformulasikan pada teori permainan mencakup keputusan (strategi) dari setiap agen danpayoffyang berupa hasil dari pengambilan keputusan tersebut. Apabila digambarkan pada agen $A$ dan $B$ ,maka agen $A$ dapat memiliki strategi $S_{1}^{A}$ , $S_{2}^{A}$ ,..., sampai $S_{n}^{A}$ dan agen $B$ memiliki strategi $S_{1}^{B}$ , $S_{2}^{B}$ ,..., sampai $S_{m}^{B}$ .Kemungkinan hasil ataupayoffyang diperoleh agen $A$ dan $B$ dapat berjumlah $n\times m$ .Diketahui bahwa agen $A$ dan agen $B$ memilikiPayoffberupa $f_{A}(S_{n}^{A},S_{m}^{B})$ dan $f_{B}(S_{m}^{B},S_{n}^{A})$ . $f_{A}(S_{n}^{A},S_{m}^{B})$ adalah fungsipayoffdari agen $A$ mempertimbangkan strategi Agen $A$ ( $S_{n}^{A}$ ) yang ke $n$ dan strategi Agen $B$ ( $S_{m}^{B}$ ) yang ke $m$ .Tabel matrikspayoffdari agen $A$ dan $B$ adalah sebagai berikut:


		Agen $B$
		$S_{1}^{B}$	$S_{2}^{B}$	...	$S_{m}^{B}$
Agen $A$	$S_{1}^{A}$	$f_{A}(S_{1}^{A},S_{1}^{B}),f_{B}(S_{1}^{B},S_{1}^{A})$	$f_{A}(S_{1}^{A},S_{2}^{B}),f_{B}(S_{2}^{B},S_{1}^{A})$	...	$f_{A}(S_{1}^{A},S_{m}^{B}),f_{B}(S_{m}^{B},S_{1}^{A})$
	$S_{2}^{A}$	$f_{A}(S_{2}^{A},S_{1}^{B}),f_{B}(S_{1}^{B},S_{2}^{A})$	$f_{A}(S_{2}^{A},S_{2}^{B}),f_{B}(S_{2}^{B},S_{2}^{A})$	...	$f_{A}(S_{2}^{A},S_{m}^{B}),f_{B}(S_{m}^{B},S_{2}^{A})$
	...	...	...	...	...
	$S_{n}^{A}$	$f_{A}(S_{n}^{A},S_{1}^{B}),f_{B}(S_{1}^{B},S_{n}^{A})$	$f_{A}(S_{n}^{A},S_{2}^{B}),f_{B}(S_{2}^{B},S_{n}^{A})$		$f_{A}(S_{n}^{A},S_{m}^{B}),f_{B}(S_{m}^{B},S_{n}^{A})$

Penyelesaian atau solusi dari permasalahan ini disebut ini keseimbanganNash(Nash Equilibrium) apabila setiap agen sudah mencapaipayoffmaksimum tergantung dari strategi agen lain dan seluruh agen tidak dapat lagi merubah strateginya. KeseimbanganNashditemukan olehJohn Forbes Nash Jr.dalam studinya yang berjudulNoncooperative games^[3].Sebagai contoh, permasalahandilema tahanan(prisoner's dilemma) adalah penerapan teori permainan untuk dua tahanan yang sedang diinterogasi. Tahanan $A$ dan $B$ ditangkap karena kejahatan yang dilakukan mereka secara bersamaan oleh penegak hukum. Setiap tahanan yang diinterogasi memiliki dua strategi yaitumengakui kejahatannyaatautidak.Payoffdari kedua tahanan ini adalah lama tahanan akan dipenjara. Setiap strategi yang dilakukan akan menghasilkan payoff yang berbeda-beda untuk setiap Tahanan. Jika dimodelkan dengan matrikspayoff,strategi danpayoffkedua tahanan adalah berikut ini:

		Pengakuan Tahanan $B$
		Mengaku $(S_{1}^{B})$	Tidak $(S_{2}^{B})$
Pengakuan Tahanan $A$	Mengaku $(S_{1}^{A})$	$f_{A}(S_{1}^{A},S_{1}^{B})=$ 3 tahun $f_{B}(S_{1}^{B},S_{1}^{A})=$ 3 tahun	$f_{A}(S_{1}^{A},S_{2}^{B})=$ bebas $f_{B}(S_{2}^{B},S_{1}^{A})=$ 5 tahun
Pengakuan Tahanan $A$	Tidak $(S_{2}^{A})$	$f_{A}(S_{2}^{A},S_{1}^{B})=$ 5 tahun $f_{B}(S_{1}^{B},S_{2}^{A})=$ bebas	$f_{A}(S_{2}^{A},S_{2}^{B})=$ 1 tahun $f_{B}(S_{2}^{B},S_{2}^{A})=$ 1 tahun

Contoh matrikspayoffmenunjukan efek dari penetapan setiap strategi tahanan $A$ dan $B$ terhadap lama mereka akan dipenjara. Sebagai contoh, Jika tahanan $A$ mengakui perbuatannya dan tahanan $B$ tidak, maka tahanan $A$ akan bebas dan tahanan $B$ dipenjara selama 5 tahun. Berdasar dari konsep keseimbanganNash,jika tahanan $B$ memilih mengaku, maka respon terbaik tahanan $A$ adalah juga mengakui perbuatannya. Jika tahanan $B$ memilih untuk tidak mengakui, respon terbaik tahanan $A$ adalah masih mengakui perbuatannya. Apapun strategi yang dipilih tahanan $B$ ,tahanan $A$ sebaiknya memilih untuk mengakui perbuatannya. Hal ini pun juga berlaku untuk tahanan $B$ .Jika tahanan $A$ memilih mengaku, maka respon terbaik tahanan $B$ adalah juga mengakui perbuatannya. Jika tahanan $A$ memilih untuk tidak mengakui, respon terbaik tahanan $B$ adalah masih mengakui perbuatannya. Alhasil, kedua tahanan akan memilih untuk mengakui perbuatannya. Hal ini disebut keseimbanganNashdimana kedua tahanan yang sudah mengaku tidak lagi dapat memperbaharui strateginya. Akhirnya kedua tahanan memilikipayoffberupa dipenjara selama 3 tahun. Kondisi permainan yang dilakukan juga termasuk kedalam permainan nonkooperatif (Noncooperative game), dimana semua agen rasional berkompetisi tanpa ada interaksi antar mereka. Jika kedua tahanan memilih untuk berinteraksi, maka satu-satunyapayoffpaling optimal diperoleh jika keduanya tidak mengaku. Mereka akan hanya dipenjara selama satu tahun. Skema interaksi ini dinamakan permainan kooperatif (Cooperative game).

Selain dimodelkan dengan matrikspayoff,permainan dapat dimodelkan dengan menggunakan pohon keputusan (Decision tree). Penggunaan pohon keputusan dalam teori permainan dapat merujuk kepada permainan sekuensial (Sequential game) dan permainanextensive form.Jika diaplikasikan pada permainan dilema tahanan, strategi tahanan $A$ yang dari tahanan $B$ dapat dilihat pada gambar pohon keputusan.

Penerapan teori permainan dalam pemodelan ekonomi

Pemodelan kompetisi antar agen dari teori permainan dan penyelesaian solusinya berupa keseimbanganNashmemberikan beberapa dampak pada berbagai sektor kehidupan masyarakat. Salah satunya adalah dalam pemodelan ekonomi. Beberapa model yang terdampak adalah model kuantitasCournot,model penetapan hargaBertrand,dan model kepemimpinanStackelberg.

Model kuantitasCournot

Pada 1838,matematikawandanekonom prancisyang bernamaAntoine Augustin Cournot,menerbitkan sebuah publikasi dengan judulRecherches sur les principes mathématiques de la Théorie des richesses^[4].Publikasinya menjelaskan bahwa terdapat persaingan antar perusahaan dalam hal kuantitas produksi sebuah barang. Keputusan antar perusahaan sifatnya independen namun rasional. Terdapat beberapa asumsi dan batasan untuk menerapkan pemodelanCournot:

Terdapat lebih dari satu perusahaan yang berkompetisi secara simultan dengan produk barang yang homogen (tidak berbeda).
Perusahaan-perusahaan yang terlibat berkompetisi dalam bentuk pola informasi yang sempurna dan lengkap (perfect and complete information).
Semua perusahaan yang berkompetisi tidak ada indikasi untuk bekerja sama dan berbagiinformasi(Information sharing).
Perusahaan-perusahaan yang berkompetisi memiliki kekuatan pasar yang seimbang, sehingga mereka menetapkan keputusannnya secara simultan (Simultaneous).
Semua perusahaan berkompetisi untuk menghasilkan kuantitas produk yang cukup dan jumlah kuantitas produk mempengaruhi harga.
Perusahaan yang berkompetisi bertindak rasional dan strategis untuk memaksimalkan pendapatan, keuntungan, ataupayoffmereka.

Berdasar pada hubungan penawaran dan permintaan (supply and demand), modelCournotfokus pada fungsi permintaan dimana kenaikan jumlah kuantitas yang diproduksi akan menurunkan harga dari produk itu. Sebagai contoh jika perusahaan $A$ berkompetisi kuantitas dengan perusahaan $B$ .Perusahaan $A$ menghasilkan produk sebesar $q_{A}$ unit dan perusahaan $B$ menghasilkan produk sebesar $q_{B}$ unit. Jumlah kuantitas produk digambarkan pada fungsi $Q=q_{A}+q_{B}$ .Karena harga dipengaruhi oleh kuantitas produk pada model ini, maka fungsi harga digambarkan pada persamaan berikut:

${\begin{aligned}p(Q)&=a-b\times Q\\p(q_{A},q_{B})&=a-b\times (q_{A}+q_{B})\end{aligned}}$

Model penetapan harga diatas menjelaskan bahwa setiap harga $p(Q)$ atau $p(q_{A},q_{B})$ sangat bergantung terhadap jumlah kuantitas $Q$ unit dari $q_{A}$ dan $q_{B}$ .Parameter $a$ adalah nilaiinterceptdari sebuah modelekonometrikayang menjelaskan kesediaan pasar untuk membayar jika produk sama sekali tidak tersedia. Parameter $b$ adalah nilaislopeyang menunjukan besar pengaruh kuantitas terhadap perubahan harga. Parameter ini juga dapat dikatakan sebagai elastisitas harga dengan satuan ${\textstyle {\frac {\text{harga}}{\text{unit}}}}$ .Model harga ini juga terkenal dengan sebutan fungsi permintaan terbalik (inverse demand function). Fungsi ini dipakai kembali pada penetapan modelpendapatan(revenue) untuk perusahaan $A$ dan $B$ .

${\begin{aligned}\pi _{A}(q_{A},q_{B})&=p(q_{A},q_{B})\times q_{A}\\&=[a-b\times (q_{A}+q_{B})]\times q_{A}\\\pi _{B}(q_{B},q_{A})&=p(q_{A},q_{B})\times q_{B}\\&=[a-b\times (q_{A}+q_{B})]\times q_{B}\end{aligned}}$

Perusahaan $A$ dan $B$ akan menerima pendapatan sebesar $\pi _{A}$ dan $\pi _{B}$ .Pendapatannya berupa jumlah harga yang ditetapkan ( $p(q_{A},q_{B})$ ) dikalikan dengan kuantitas produksi dari masing masing perusahaan ( $q_{A}$ dan $q_{B}$ ). Karena fungsi pendapatan dari perusahaan $A$ dan $B$ berbentuk model ordo kedua (second-order), maka kedua model diasumsikan memiliki bentukconcave.Untuk menemukan titik optimum global, kedua fungsi pendapatan diturunkan. Kondisi ordo pertama dari model pendapatan adalah:

${\begin{aligned}{d\pi _{A}(q_{A},q_{B}) \over dq_{A}}&=a-b(2q_{A}+q_{b})=0\\{d\pi _{B}(q_{B},q_{A}) \over dq_{B}}&=a-b(q_{A}+2q_{b})=0\\\end{aligned}}$

Dari turunan model pendapatan perusahaan $A$ dan $B$ ,respon terbaik (best response function) dari setiap perusahaan untuk menghasilkan kuantitas produk dapat diperoleh. Dalam teori permainan, respon terbaik adalah strategi terbaik yang ditentukan oleh agen itu sendiri yang tergantung pada strategi dari kompetitor. Fungsi dari respon terbaik setiap perusahaan merupakan modifikasi dari turunan model pendapatan. Fungsi perusahaan $A$ dan $B$ adalah sebagai berikut:

${\begin{aligned}a-b(2q_{A}+q_{b})&=0\\q_{A}&={\frac {a-b\times q_{B}}{2b}}\\a-b(q_{A}+2q_{B})&=0\\q_{B}&={\frac {a-b\times q_{A}}{2b}}\end{aligned}}$

Setelah menemukan respon terbaik dari setiap perusahaan untuk memaksimalkan pendapatannya, hasil keseimbanganNashpada modelCournotdapat ditemukan melalui persamaan respon terbaik dari $q_{A}$ dan $q_{B}$ atau dari ${\textstyle {\frac {d\pi _{A}(q_{A},q_{B})}{dq_{A}}}={\frac {d\pi _{B}(q_{B},q_{A})}{dq_{B}}}=0}$ .Dengan mensubsitusi fungsi $q_{A}$ pada fungsi $q_{B}$ ,keseimbanganCournot Nashditemukan pada:

${\begin{aligned}q_{B}&={\frac {a-b\times q_{A}}{2b}}\\&={\frac {a-b\times ({\frac {a-b\times q_{B}}{2b}})}{2b}}\\&={\frac {a}{3b}}\\q_{A}&={\frac {a-b\times q_{B}}{2b}}\\&={\frac {a-b\times ({\frac {a}{3b}})}{2b}}\\&={\frac {a}{3b}}\end{aligned}}$

Jadi perusahaan $A$ dan $B$ akan mencoba untuk memproduksi $q_{A}$ dan $q_{B}$ produk sebesar ${\textstyle {\frac {a}{3b}}}$ unit. Berdasar keputusan yang sudah seimbang, keluarannya adalah sebagai berikut:

${\begin{aligned}Q&=q_{A}+q_{B}&\\&={\frac {a}{3b}}+{\frac {a}{3b}}\\&={\frac {2a}{3b}}\\p(q_{A},q_{B})&=a-b\times (q_{A}+q_{B})\\&=a-b({\frac {2a}{3b}})\\&={\frac {a}{3}}\\\pi _{A}&=\pi _{B}\\p(q_{A},q_{B})\times q_{A}&=p(q_{A},q_{B})\times q_{B}\\&={\frac {a}{3}}\times {\frac {a}{3b}}\\&={\frac {a^{2}}{9b}}\end{aligned}}$

PermodelanCournotyang dilakukan tentunya cukup terbatas. Apabila diterapkan model keuntungan (profit) dengan nilai biaya (cost) yang berbeda akan menghasilkan perspektif keseimbangan yang berbeda juga.

Model Penetapan HargaBertrand

Pada tahun 1883,matematikawandanekonom prancisyang bernama Joseph Louis François Bertrand, mengkritisi modelCournotdalam publikasinya yang berjudulBook Review of “Théorie Mathématique de la Richesse Social” and of “Recherches sur les Principes Mathématique de la Theorie des Richessesyang diterbitkan diJournal des savants^[5].Bertrand mengkritisi model kuantitasCournotbahwa perusahaan-perusahaan lebih memiliki kompetisi dalam hal perang harga. Penetapan harga tentunya baru akan memperngaruhi kuantitas produksi. Keputusan antar perusahaan sifatnya masih independen dan rasional seperti modelCournot.Terdapat beberapa asumsi dan batasan untuk menerapkan pemodelanBertrand:

Terdapat lebih dari satu perusahaan yang berkompetisi secara simultan dengan produk barang yang homogen (tidak berbeda).
Perusahaan-perusahaan yang terlibat berkompetisi dalam bentuk pola informasi yang sempurna dan lengkap (perfect and complete information).
Semua perusahaan yang berkompetisi tidak ada indikasi untuk bekerja sama dan berbagiinformasi(Information sharing).
Perusahaan-perusahaan yang berkompetisi memiliki kekuatan pasar yang seimbang, sehingga mereka menetapkan keputusannnya secara simultan (Simultaneous).
Semua perusahaan berkompetisi untuk menetapkan harga yang tepat dan harga produk mempengaruhi kuantitas produksi.
Perusahaan yang berkompetisi bertindak rasional dan strategis untuk memaksimalkan pendapatan, keuntungan, ataupayoffmereka.
Pola permintaan sangat dipengaruhi oleh keputusan harga setiap perusahaan yang berkompetisi.

Poin 1, 2, 3, 4,dan 6 sama seperti modelCournot,yang membedakan modelBertranddenganCournotadalah pada poin 5 dan 7. Berdasar pada hubungan penawaran dan permintaan (supply and demand), modelBertrandfokus pada fungsi permintaan dimana kenaikan harga akan permintaan (demand) dari produk itu. Sebagai contoh jika perusahaan $A$ berkompetisi harga dengan perusahaan $B$ .Perusahaan $A$ menetapkan harga produk sebesar $P_{A}$ dan perusahaan $B$ menetapkan harga produk sebesar $P_{B}$ .Jumlah kuantitas produk digambarkan pada fungsi $Q=D_{A}(P_{A},P_{B})+D_{B}(P_{B},P_{A})$ dimana kuantitas produk akan sama dengan total permintaan pada perusahaan $A$ dan $B$ .Permintaan pada perusahaan $A$ ( $D_{A}$ ) akan dipengaruhi oleh penetapan harga perusahaan $A$ itu sendiri ( $P_{A}$ ) dan harga dari kompetitor ( $P_{B}$ ). Permintaan pada perusahaan $B$ ( $D_{B}$ ) akan dipengaruhi oleh penetapan harga perusahaan $B$ itu sendiri ( $P_{B}$ ) dan harga dari kompetitor ( $P_{A}$ ). Model permintaan ini juga terkenal dengan sebutanfungsi permintaan(demand function). Fungsi ini dipakai pada penetapan modelpendapatan(revenue) untuk perusahaan $A$ dan $B$ .

${\begin{aligned}\pi _{A}(P_{A},P_{B})&=P_{A}\times D_{A}(P_{A},P_{B})\\\pi _{B}(P_{B},P_{A})&=P_{B}\times D_{B}(P_{B},P_{A})\end{aligned}}$

Sama seperti modelCournot,perusahaan $A$ dan $B$ akan menerima pendapatan sebesar $\pi _{A}$ dan $\pi _{B}$ .Pendapatannya berupa jumlah harga yang ditetapkan ( $P_{A}$ dan $P_{B}$ ) dikalikan dengan permintaan produk dari masing masing perusahaan ( $D_{A}$ dan $D_{B}$ ). Karena fungsi pendapatan dari perusahaan $A$ dan $B$ berbentuk model ordo kedua (second-order), maka kedua model diasumsikan memiliki bentukconcave.Untuk menemukan titik optimum global, kedua fungsi pendapatan diturunkan. Kondisi ordo pertama dari model pendapatan dapat diperoleh jika fungsi pendapatan diturunkan terhadap masing-masing keputusan harga. Respon terbaik dapat diperoleh jika ${\textstyle {d\pi _{A}(P_{A},P_{B}) \over dP_{A}}=0}$ dan ${\textstyle {d\pi _{B}(P_{B},P_{A}) \over dP_{B}}=0}$ .KeseimbanganBertrand Nashakan ditemukan pada kondisi berikut:

${\begin{aligned}D_{A}>D_{B}&=0&{\text{jika}}\quad P_{B}\geq P_{A}\\D_{B}>D_{A}&=0&{\text{jika}}\quad P_{A}\geq P_{B}\\D_{B}=D_{A}&&{\text{jika}}\quad P_{A}=P_{B}\end{aligned}}$

PermodelanBertrandpun juga cukup terbatas dengan beberapa asumsi dan batasan. ModelBertrandmengasumsikan bahwa permintaan sangat dipengaruhi oleh harga. Tentunya, setiap permintaan memiliki pola preferensi yang berbeda (tidak hanya harga). Apabila diterapkan model keuntungan (profit) dengan nilai biaya (cost) yang berbeda pada setiap perusahaan, akan menghasilkan perspektif keseimbangan yang berbeda juga.

Model kepemimpinanStackelberg

Pada 1934,matematikawandanekonom jermanyang bernama Heinrich Freiherr von Stackelberg, mengembangkan model pasar kepemimpinan pada bukunya yang berjudulMarket Structure and Equilibrium(Marktform und Gleichgewicht)^[6].Stackelberg menuturkan bahwa terdapat persaingan antar perusahaan dimana beberapa perusahaan pasti akan memiliki kekuatan pasar yang lebih kuat. ModelStackelbergmemiliki dua jenis agen dalam permainannya, pemimpin (leader) dan pengikut (follower). Pemimpin merupakan tipe pemain dengan kekuatan pasar yang lebih kuat dibanding tipe pemain pengikut. Pemimpin akan menentukan strateginya lebih dahulu (First mover) dibanding pengikut. Alhasil, tipe permainan dari modelStackelbergadalah permainan sekuensial (Sequential Games). Penyelesaian tipe permainan ini menggunakanbackward induction.Terdapat beberapa asumsi dan batasan untuk menerapkan pemodelanStackelberg:

Terdapat lebih dari satu perusahaan yang berkompetisi secara simultan dengan produk barang yang homogen (tidak berbeda).
Perusahaan-perusahaan yang terlibat berkompetisi dalam bentuk pola informasi yang sempurna dan lengkap (perfect and complete information).
Semua perusahaan yang berkompetisi tidak ada indikasi untuk bekerja sama dan berbagiinformasi(Information sharing).
Perusahaan-perusahaan yang berkompetisi memiliki kekuatan pasar yang tidak seimbang. Beberapa perusahaan merupakan perusahaan berkekuatan pasar yang besar (pemimpin) dan berkekuatan pasar yang kecil (pengikut)
Perusahaan yang berkompetisi bertindak rasional dan strategis untuk memaksimalkan pendapatan, keuntungan, ataupayoffmereka.

Poin 1, 2, 3 dan 5 cukup sama dengan pemodelanCournotdanBertrand.Kunci dari model ini adalah pada poin 4. Kondisi keseimbangan dari permainan sekuensial disebutSubperfect Nash Equilibrium.Hal ini cukup berseberangan dengan konsep keseimbanganNashdimana semua agen yang berkompetisi menetapkan strateginya secara simultan. Sebagai contoh pada pemodelanCournot,perusahaan $A$ adalah pemimpin dan perusahaan $B$ adalah pengikut. Artinya, perusahaan $A$ memilliki kekuatan pasar yang lebih besar dibanding perusahaan $B$ .DalamCournot,perusahaan $A$ menghasilkan produk sebesar $q_{A}$ unit dan perusahaan $B$ menghasilkan produk sebesar $q_{B}$ unit. PemodelanStackelbergyang diformulasikan dengan pendekatan pemrograman matematika (Mathematical Programming) disebut pemrogramanBilevelatauNested Optimization.Bentuk model pendapatan dari perusahaan $A$ dan $B$ adalah sebagai berikut.

${\begin{aligned}&\max(q_{A})\quad \pi _{A}(q_{A},q_{B})=[a-b\times (q_{A}+q_{B})]\times q_{A}\\&S.T\\&q_{B}\in \arg \max(q_{B})\quad \pi _{B}(q_{B},q_{A})=[a-b\times (q_{A}+q_{B})]\times q_{B}\end{aligned}}$

Pendekatan yang digunakan untuk menyelesaikan model berikut adalahBackward Induction.Perusahaan $A$ ,sebagai pemimpin, dapat mengantisipasi gerakan dari perusahaan $B$ sebagai pengikut. Jadi dalam fungsi pendapatan perusahaan $A$ ,respon terbaik dari perusahaan $B$ digunakan untuk mensubsitusi $q_{B}$ .Alhasil, perusahaan $A$ dapat dikatakan bergerak lebih dahulu (first mover).

${\begin{aligned}q_{B}&={\frac {a-b\times q_{A}}{2b}}\\\pi _{A}(q_{A})&=[a-b\times (q_{A}+{\frac {a-b\times q_{A}}{2b}})]\times q_{A}\\\end{aligned}}$

Karena fungsi pendapatan perusahaan $A$ masih termasuk ke model ordo kedua (second-order), maka fungsi pendapatan diturunkan terhadap $q_{A}$ untuk melihat kondisi ordo pertamanya (first-order).

${d\pi _{A}(q_{A}) \over dq_{A}}={\frac {b^{2}-2}{2}}\times (a-2b\times q_{A})=0$

Kondisi optimal dari perusahaan $A$ adalah:

$q_{A}={\frac {a}{2b}}$

Berdasar strategi dari $q_{A}$ dari perusahaan $A$ ,maka perusahaan $B$ akan menentukan strateginya berdasar respon terbaiknya. Dengan mensubsitusi fungsi $q_{A}$ pada respon terbaik $q_{B}$ ,strategi perusahaan $B$ adalah sebagai berikut:

${\begin{aligned}q_{B}&={\frac {a-b\times {\frac {a}{2b}}}{2b}}\\&={\frac {a}{4b}}\\\end{aligned}}$

Dengan keputusan strategi yang sudah ditetapkan perusahaan $A$ dan $B$ ,strategi mencapaiSubperfect Nash Equilibrium.Jadi perusahaan $A$ dan $B$ akan mencoba untuk memproduksi $q_{A}$ dan $q_{B}$ produk sebesar ${\frac {a}{2b}}$ dan ${\frac {a}{4b}}$ unit. Berdasar keputusan yang sudah seimbang, keluarannya adalah sebagai berikut:

${\begin{aligned}Q&=q_{A}+q_{B}&\\&={\frac {a}{2b}}+{\frac {a}{4b}}\\&={\frac {3a}{4b}}\\p(q_{A},q_{B})&=a-b\times (q_{A}+q_{B})\\&=a-b({\frac {3a}{4b}})\\&={\frac {a}{4}}\\\pi _{A}&=p(q_{A},q_{B})\times q_{A}\\&{\frac {a}{4}}\times {\frac {a}{2b}}\\&={\frac {a^{2}}{8b}}\\\pi _{b}&=p(q_{A},q_{B})\times q_{B}\\&{\frac {a}{4}}\times {\frac {a}{4b}}\\&={\frac {a^{2}}{16b}}\end{aligned}}$

Dari strategi, harga, danpayoffdari setiap perusahaan, perusahaan $A$ akan menghasilkan kuantitas produksi 2 kali lipat dibanding perusahaan $B$ ( ${\frac {q_{A}}{q_{B}}}={\frac {\frac {a}{2b}}{\frac {a}{4b}}}=2$ ) dan perusahaan $A$ akan mendapatkan pendapatan 2 kali lipat dari perusahaan $B$ ( ${\frac {\pi _{A}}{\pi _{B}}}={\frac {\frac {a^{2}}{8b}}{\frac {a^{2}}{16b}}}=2$ ). Hal ini menunjukan sebuah keuntungan menjadi pemimpin atau agen dengan cakupan pasar yang lebih besar dibanding dengan pengikut.

SkemaCournotvs.Stackelberg

Dengan melakukan perbandingan antara keseimbanganNashdariCournotdanSubperfect Nash EquilibriumdariStackelberg,beberapa poin dihasilkan:

Keputusan dari pemimpin pasar (leader)Stackelbergakan produksi lebih besar 1,5 kali lipat dibanding perusahaan dengan skema permainan simultan ( ${\frac {q_{A}(Stackelberg)}{q_{A}(Cournot)}}={\frac {\frac {a}{2b}}{\frac {a}{3b}}}=1{\frac {1}{2}}$ ).
Keputusan dari pengikut pasar (follower)Stackelbergakan produksi lebih kecil 0,75 kali lipat dibanding perusahaan dengan skema permainan simultan ( ${\frac {q_{B}(Stackelberg)}{q_{B}(Cournot)}}={\frac {\frac {a}{4b}}{\frac {a}{3b}}}={\frac {3}{4}}$ ).
Harga hasil produksi pada permainanStackelberglebih kecil 0.75 kali lipat dibanding permainanCournot( ${\frac {p(Stackelberg)}{p(Cournot)}}={\frac {\frac {a}{4}}{\frac {a}{3}}}={\frac {3}{4}}$ )
Pendapatan dari pemimpin pasar (leader)Stackelbergakan lebih besar $1{\frac {1}{8}}$ kali lipat dibanding perusahaan dengan skema permainan simultan ( ${\frac {\pi _{A}(Stackelberg)}{\pi _{A}(Cournot)}}={\frac {\frac {a^{2}}{8b}}{\frac {a^{2}}{9b}}}=1{\frac {1}{8}}$ )
Pendapatan dari pengikut pasar (follower)Stackelbergakan lebih kecil ${\frac {9}{16}}$ kali lipat dibanding perusahaan dengan skema permainan simultan ( ${\frac {\pi _{B}(Stackelberg)}{\pi _{B}(Cournot)}}={\frac {\frac {a^{2}}{16b}}{\frac {a}{9b}}}={\frac {9}{16}}$ ).

Artikel bertopikmatematikaini adalah sebuahrintisan.Anda dapat membantu Wikipedia denganmengembangkannya.

Artikel bertopik ekonomi ini adalah sebuahrintisan.Anda dapat membantu Wikipedia denganmengembangkannya.

^Carpenter, J., & Robbett, A. (2022).Game Theory and Behavior.MIT Press.
^Bicchieri, Cristina. (2004-02-05). Mele, Alfred R.; Rawling, Piers, ed.RATIONALITY AND GAME THEORY.Oxford University Press. hlm. 182–205.doi:10.1093/0195145399.003.0010.ISBN 978-0-19-514539-7.
^Nash Jr, John (1996-12-26).Essays on Game Theory.Edward Elgar Publishing.doi:10.4337/9781781956298.00009.ISBN 978-1-78195-629-8.
^Cournot, Antoine-Augustin (1838).Recherches sur les principes mathématiques de la théorie des richesses par Augustin Cournot(dalam bahasa Prancis). chez L. Hachette.
^J, Bertrand (1883)."Book Review of Theorie Mathematique de la Richesse Social and of Recherches sur les Principes Mathematiques de la Theorie des Richesses".Journal des Savants.
^von Stackelberg, Heinrich (2011).Market Structure and Equilibrium(dalam bahasa Inggris). Berlin, Heidelberg: Springer Berlin Heidelberg.doi:10.1007/978-3-642-12586-7.ISBN 978-3-642-12585-0.

[1] Carpenter, J., & Robbett, A. (2022).Game Theory and Behavior.MIT Press.

[2] Bicchieri, Cristina. (2004-02-05). Mele, Alfred R.; Rawling, Piers, ed.RATIONALITY AND GAME THEORY.Oxford University Press. hlm. 182–205.doi:10.1093/0195145399.003.0010.ISBN 978-0-19-514539-7.

[3] Nash Jr, John (1996-12-26).Essays on Game Theory.Edward Elgar Publishing.doi:10.4337/9781781956298.00009.ISBN 978-1-78195-629-8.

[4] Cournot, Antoine-Augustin (1838).Recherches sur les principes mathématiques de la théorie des richesses par Augustin Cournot(dalam bahasa Prancis). chez L. Hachette.

[5] J, Bertrand (1883)."Book Review of Theorie Mathematique de la Richesse Social and of Recherches sur les Principes Mathematiques de la Theorie des Richesses".Journal des Savants.

[6] von Stackelberg, Heinrich (2011).Market Structure and Equilibrium(dalam bahasa Inggris). Berlin, Heidelberg: Springer Berlin Heidelberg.doi:10.1007/978-3-642-12586-7.ISBN 978-3-642-12585-0.

[1]

[2]

[3]

[4]

[5]

[6]

l b s Matematika(Bidang matematika)
Fondasi	Filsafat matematika Logika matematika Teori himpunan Teori informasi Teori kategori Teori tipe
Aljabar	Abstrak Elementer Homologis Komutatif Linear Multilinear Universal Teori grup Teori representasi
Analisis	Kalkulus Analisis fungsional Analisis harmonik Analisis kompleks Analisis real Persamaan diferensial Teori ukuran Teori sistem dinamis
Diskret	Kombinatorika Teori graf Teori order
Geometri	Aljabar Analitis Diferensial Diskrit Euklides Hingga Trigonometri
Komputasi	Analisis numerik(Topik) Ilmu komputer Komputasi simbolik Teori komputasi Teori kompleksitas komputasi Optimisasi matematika
Teori bilangan	Aritmetika Geometri Diophantine Teori bilangan aljabar Teori bilangan analitis
Topologi	Teori homotopi Aljabar Diferensial Geometris Umum
Terapan	Matematika biologi Matematika ekonomi Matematika keuangan Fisika matematis Kimia matematika Psikologi matematis Statistika Statistika matematika Teori peluang Ilmu sistem(Teori kendali,Teori permainan,Riset operasi)
Divisi	Matematika murni Matematika terapan Matematika diskret Matematika komputasi
Topik terkait	Matematika dan seni Matematika rekreasi Pendidikan matematika Sejarah matematika
Kategori Portal matematika Kerangka Daftar

Pengawasan otoritas
Umum	Integrated Authority File (Jerman)
Perpustakaan nasional	Spanyol Prancis (data) Amerika Serikat Jepang Republik Ceko
Lain-lain	Faceted Application of Subject Terminology Microsoft Academic SUDOC (Prancis) 1 2