博弈最優(yōu)策略范文

時(shí)間:2023-08-15 17:31:43

導(dǎo)語(yǔ):如何才能寫(xiě)好一篇博弈最優(yōu)策略,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

博弈最優(yōu)策略

篇1

論文摘要:信貸市場(chǎng)中,企業(yè)獲得貸款后基于自身利益的驅(qū)動(dòng)會(huì)產(chǎn)生道德風(fēng)險(xiǎn),從而加大了銀行信貸風(fēng)險(xiǎn)。本文建立了銀企博弈模型,得出銀行可以將審核概率控制在一定閥值上,從而降低企業(yè)的道德風(fēng)險(xiǎn)。在此基礎(chǔ)上,設(shè)計(jì)了銀行對(duì)借款企業(yè)的激勵(lì)契約,得出抵押物價(jià)值和貸款利率的最優(yōu)線(xiàn)性關(guān)系。

隨著我國(guó)金融業(yè)的不斷開(kāi)放,我國(guó)商業(yè)銀行面臨著日益激烈的競(jìng)爭(zhēng),借款企業(yè)的道德風(fēng)險(xiǎn)已經(jīng)成為銀行較高不良資產(chǎn)率的主要原因之一發(fā)放貸款后,由于信息不對(duì)稱(chēng),銀行往往無(wú)法對(duì)企業(yè)進(jìn)行有效監(jiān)控,企業(yè)可能做出損害銀行利益的行為,這就是企業(yè)道德風(fēng)險(xiǎn)。

銀企博弈模型

交易雙方為銀行和借款企業(yè),假設(shè)兩者均風(fēng)險(xiǎn)中立。博弈順序如下:借貸雙方針對(duì)某一項(xiàng)目簽訂借貸合同,貸款額度為B。合同規(guī)定抵押價(jià)值Q以及貸款利率i等,顯然Q>B。企業(yè)可選擇“不改變資金用途”或“改變資金用途”兩種純策略,對(duì)應(yīng)的項(xiàng)目失敗概率t1和t2,顯然,t10,高風(fēng)險(xiǎn)意味著高收益)。銀行收益始終為r,有r=iB。項(xiàng)目失敗后,銀行由于存在審核成本,故其策略有“審核”與“不審核”,對(duì)應(yīng)概率分別為α和1-α,審核成本為C。如果審查出企業(yè)“改變資金用途”,則銀行沒(méi)收抵押后并給予企業(yè)懲罰π,其中可以是信用等級(jí)的降低等。

雙方收益函數(shù):企業(yè)不改變資金用途,如果項(xiàng)目成功,企業(yè)和銀行收益分別為R-r 和r;如果項(xiàng)目失敗并且銀行選擇審核,雙方收益分別為B-Q和Q-B-C,如果銀行選擇不審,雙方收益分別為B-Q和Q-B。企業(yè)改變資金用途,如果項(xiàng)目成功,企業(yè)和銀行收益分別為R+Δ-r和r;如果項(xiàng)目失敗并且銀行選擇審核,雙方收益分別為B-Q-π和π+Q-B-C,如果銀行選擇不審,雙方收益分別為B-Q和Q-B。

博弈的均衡分析

如果一個(gè)混合策略是企業(yè)的最優(yōu)選擇,那么意味著企業(yè)是否改變資金用途的期望收益無(wú)差異,即:(1-t1)(R-r)+t1[α(B-Q)+(1-α)(B-Q)]=(1-t2)(R-r+Δ)+t2[α(B-Q-π)+(1-α)(B-Q)],得出:

同理,如果一個(gè)混合策略是銀行的最優(yōu)選擇,那么意味著銀行審核與不審核之間的期望收益是無(wú)差異的。引入一個(gè)條件概率λ(c/f),表示項(xiàng)目失敗后銀行認(rèn)為企業(yè)改變資金用途的概率,由貝葉斯法則得: 這種情況下銀行審核與不審核的期望收益相同,即:λ(c/f)(π+Q-B-C)+[1-λ(c/f )](Q-B-C)=Q-B,得出:

因此,所求的α和p即為所求納什均衡點(diǎn)。這表明當(dāng)銀行審核概率低于α?xí)r,企業(yè)最優(yōu)策略是改變資金用途;當(dāng)銀行認(rèn)為企業(yè)改變資金用途的概率小于p時(shí),考慮到審核成本,銀行選擇不去審核。所以,銀行可以將審核概率控制在一定閥值之上,就能夠有效控制道德風(fēng)險(xiǎn)。

激勵(lì)契約設(shè)計(jì)

銀行在設(shè)計(jì)契約時(shí),應(yīng)理性預(yù)期到雙方的博弈策略選擇及其各種局勢(shì)的支付,進(jìn)而設(shè)計(jì)激勵(lì)契約。設(shè)計(jì)契約如下:

{(1-p)(1-t1)r+(1-p)t1[α(B-Q-C)+(1-α)(Q-B )]+p (1-t2)r+pt2[α(π+Q-B )+(1-α)(Q-B )]} (1)

s.t(1-t1)(R-r)+t1(B-Q)≥0(2)

(1-t1)(R-r)+t1(B-Q)≥(1-t2)(R-r+Δ)+t2[α(B-Q-π)+(1-α)(B-Q)] (3)

r=iB (4)

銀行的最優(yōu)策略是使自身期望收益即(公式1)達(dá)到最大;同時(shí)應(yīng)滿(mǎn)足不改變資金用途的企業(yè)的參與約束(公式2);為激勵(lì)企業(yè)不改變資金用途,還應(yīng)滿(mǎn)足激勵(lì)約束(公式3),即不改變資金用途的企業(yè)獲得的收益應(yīng)大于改變資金用途的企業(yè)。(公式4)為r與B的關(guān)系。

添加參與約束因子β和激勵(lì)約束因子γ構(gòu)造拉格朗日函數(shù),得出β=1,γ=1-p。

當(dāng)γ≠0,即p≠1時(shí),因此約束條件(2)和(3)取等號(hào),解之得:;當(dāng)γ=0,即p =1時(shí),即銀行認(rèn)為企業(yè)一定會(huì)改變資金用途,則銀行一定會(huì)審核,即α=1。

由結(jié)果可知,在最優(yōu)博弈策略的基礎(chǔ)上,銀行利潤(rùn)最大時(shí)其最優(yōu)抵押物價(jià)值和貸款利率存在以上線(xiàn)性關(guān)系。一般,當(dāng)貸款額度和貸款利率一定時(shí),抵押物價(jià)值與項(xiàng)目失敗率成反比,因此,銀行可以通過(guò)設(shè)計(jì)不同的抵押物價(jià)值要求的契約來(lái)對(duì)企業(yè)進(jìn)行激勵(lì)。

參考文獻(xiàn)

篇2

關(guān)鍵詞:博弈論;圍標(biāo)串標(biāo);治理

中圖分類(lèi)號(hào):F22 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673—291X(2012)28—0210—03

一、博弈論概述

博弈論是專(zhuān)門(mén)研究博弈如何出現(xiàn)均衡的規(guī)律的學(xué)科[1]。博弈論的思想最早出現(xiàn)于18世紀(jì),20世紀(jì)20年代,由科學(xué)家馮·諾依曼和經(jīng)濟(jì)學(xué)家?jiàn)W斯卡·摩根斯坦恩合著的《博弈與經(jīng)濟(jì)行為的理論》一書(shū)中將博弈論真正作為了一種理論研究。他們提出了策略型和廣義型等基本博弈模型、解的概念和分析方法,構(gòu)建了博弈論的理論框架。1951年納什對(duì)靜態(tài)博弈模型提出了納什均衡的概念,明示了博弈論與經(jīng)濟(jì)均衡的內(nèi)在聯(lián)系。

博弈論又稱(chēng)對(duì)策論,是研究決策主體在決策主體各方相互作用情況下如何進(jìn)行決策及有關(guān)決策均衡問(wèn)題的理論。博弈論強(qiáng)調(diào)決策主體各方策略的相互依存性,即任何一個(gè)決策主體必須在考慮其他局中人可能的策略選擇基礎(chǔ)上來(lái)確定自己的最優(yōu)行動(dòng)策略。博弈論的精髓在于博弈中的理性決策者必須考慮在其他局中人反應(yīng)的前提下來(lái)選擇自己最理想的行動(dòng)方案。所謂均衡即所有局中參與人的最優(yōu)策略組合,各方博弈產(chǎn)生的結(jié)果是一個(gè)均衡結(jié)果,它可能不是局中各方及整體的利益最大化,但它是在已給信息與知識(shí)條件下的一種必然結(jié)果,因?yàn)槿魏我环礁淖儾呗远鴮?dǎo)致均衡的變化都有可能使自己得到一個(gè)更差的結(jié)果。

博弈論假設(shè)人是理性的,即人人都會(huì)在給定的條件下想辦法使自身利益最大化。另外,人們?cè)诤献鹘煌杏袥_突,行為決策會(huì)受到相互的影響,且信息通常不對(duì)稱(chēng)。在現(xiàn)實(shí)中,博弈的最終結(jié)果往往是博弈的各參與人的策略組合達(dá)到一個(gè)均衡的結(jié)果,我們稱(chēng)之為納什均衡。一旦達(dá)到這種均衡,博弈的任何一方都不會(huì)有積極性偏離這種均衡。

在一個(gè)存在n個(gè)參與者的博弈中,假設(shè)所有參與者都是理性的,如果策略組合s*是一個(gè)均衡的話(huà),那么給定n—1個(gè)參與者的策略,某個(gè)特定參與者所選擇的策略一定是最優(yōu)的

(否則與理性人的假設(shè)相矛盾);因?yàn)槟程囟▍⑴c者是任意選取的,因而上述特性對(duì)每個(gè)參與者都成立。換言之,對(duì)于一個(gè)策略組合s*,如果保持其他參與者的策略不變,而任意一個(gè)參與者的策略都是最優(yōu)的,那么策略組合s*就是納什均衡。歸納為一句話(huà)即為:“最優(yōu)對(duì)任一參與者的任一策略成立。”簡(jiǎn)而言之,納什均衡就是在給定其他參與人策略的條件下,每個(gè)人選擇自己的最優(yōu)策略。

用數(shù)學(xué)公式可這樣表示:如果一個(gè)策略組合s*=(s*1,…,s*n)是博弈G={S,U}的一個(gè)納什均衡,那么對(duì)任一參與者i=1,2,…,n,對(duì)其任意一個(gè)策略si∈Si,不等式ui(s*i,s—i)≥ui(si,s—i)成立。

納什均衡的運(yùn)用非常廣泛,最為有名的一個(gè)例子就是由塔克給出的“囚徒困境”博弈模型。囚徒1和囚徒2共同作案,被抓住,警方將兩名囚徒分開(kāi)在兩間審訊室同時(shí)審問(wèn),他們都只有兩個(gè)選擇,招供和沉默。警方提出這樣的條件:若兩人都招供,則證據(jù)確鑿,兩人均被判六年;若一人招供,一人沉默,則招供的囚徒可立即釋放,而沉默的人則加刑二年;若兩名囚徒均不招供,則因證據(jù)不足只能判他們一年。由此分析如下:

1.參與者集合:N={1,2}。

2.策略空間:囚徒1的策略空間S1={沉默,招供},囚徒 2的策略空間S2={沉默,招供}。

3.偏好和收益函數(shù):囚徒1的偏好為,(招供,沉默),(沉默,沉默),(招供,招供),(沉默,招供)。前一項(xiàng)為囚徒1的策略,后一項(xiàng)為囚徒2的策略。囚徒2的偏好類(lèi)似。定義u1(s1j,s2k)和u2(s1j,s2k)分別為囚徒1和囚徒2的收益函數(shù)。所有收益如下:

u1(s11,s21)=—1 u1(s11,s22)=—8

u1(s12,s21)=0 u1(s12,s22)=—6

u2(s11,s21)=—1 u2(s11,s22)=0

u2(s12,s21)=—8 u2(s12,s22)=—6

顯然有:

u1(s12,s21)=0>u1(s11,s21)=—1>u1(s12,s22)=—6>u1(s11,s22)=—8

u2(s11,s22)=0>u2(s11,s21)=—1>u2(s12,s22)=—6>u2(s12,s21)=—8

囚徒困境博弈模型(見(jiàn)下頁(yè)圖1)。

圖1 囚徒博弈矩陣

由圖1可清楚的看出,在完全不清楚對(duì)方如何決策的條件下,對(duì)于囚徒1,不論囚徒2選定的是招供還是沉默,他都應(yīng)該選擇招供,因?yàn)檎泄┦撬膰?yán)格占優(yōu)策略;同樣的,對(duì)于囚徒2,不論囚徒1如何選擇,招供是他的嚴(yán)格占優(yōu)策略。于是(招供,招供)是該博弈模型的嚴(yán)格優(yōu)策略。同時(shí),(招供,招供)是該模型的一個(gè)納什均衡。如果給定囚徒2選擇招供,則囚徒1的最優(yōu)策略只可為招供;反之,給定囚徒1選擇招供,囚徒2的最優(yōu)策略也只能是招供。

二、圍標(biāo)串標(biāo)的危害

所謂“圍標(biāo)”,是指某個(gè)投標(biāo)人通過(guò)一定的途徑,秘密伙同其他投標(biāo)人共同商量投標(biāo)策略,串通投標(biāo)報(bào)價(jià),排斥其他投標(biāo)人的公平競(jìng)爭(zhēng),以非法手段贏取中標(biāo)的一種違法行為。圍標(biāo)行為的發(fā)起者稱(chēng)為圍標(biāo)人,參與圍標(biāo)行為的投標(biāo)人稱(chēng)為陪標(biāo)人。所謂“串標(biāo)”,是指在工程招投標(biāo)過(guò)程中,幾家投標(biāo)單位通過(guò)事先商定,聯(lián)合對(duì)招標(biāo)項(xiàng)目的一個(gè)或幾個(gè)招標(biāo)標(biāo)段用一致性報(bào)價(jià)、壓價(jià)或抬價(jià)等手段串通報(bào)價(jià),以達(dá)到排斥其他投標(biāo)人,控制中標(biāo)價(jià)格和中標(biāo)結(jié)果,讓他們其中的投標(biāo)者中標(biāo)的目的。

篇3

關(guān)鍵詞:水資源;政府管制;產(chǎn)權(quán);博弈

[中圖分類(lèi)號(hào)]F272.92;F224.32 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1009-9646(2012)4-0078-02

一、水資源環(huán)境污染的博弈分析

水資源環(huán)境污染問(wèn)題,即水質(zhì)博弈,廠(chǎng)商之間的“囚徒困境”問(wèn)題。首先假定市場(chǎng)自由競(jìng)爭(zhēng),政府不進(jìn)行管制,在環(huán)境污染博弈中參與人是兩個(gè)相同的排污者A與B,兩方的策略是排污與不排污,假設(shè)兩個(gè)人都不排污,有一個(gè)好的環(huán)境,大家收益都為20;如果大家都排污,這時(shí)環(huán)境惡化,每個(gè)人的收益都降低到9;如果一人不排污,另一人排污,由于治理污染要付出成本,不排污者的收益為為4,而排污者的收益為15。該博弈的支付矩陣見(jiàn)圖1:

圖1 無(wú)管制情況下排污者之間博弈

該博弈有兩個(gè)納什均衡,即(9,9)和(20,20)也就是兩方同時(shí)排污或者同時(shí)不排污。但是納什均衡(20,20)是不穩(wěn)定的,因?yàn)锳與B兩方合謀不排污是不可信的,一旦一個(gè)選擇不排污,另一個(gè)可能排污,那么排污者的收益為15,不排污者的收益為4。最后的納什均衡是(9,9),社會(huì)的總效益為18,而不是40,此實(shí)際是兩人博弈的囚徒困境。在現(xiàn)實(shí)經(jīng)濟(jì)中排污者有很多個(gè),假定有n個(gè)排污者,這實(shí)際上就是有n個(gè)局中人的博弈模型。在沒(méi)有政府監(jiān)管的情況下,這n個(gè)局中人進(jìn)行博弈,他們會(huì)根據(jù)利益最大化選擇自己的策略,要么排污要么不排污,如果大家都不排污,環(huán)境不會(huì)被污染,整個(gè)社會(huì)福利最大。但是合謀不排污是不可信的,因?yàn)槿绻悴慌盼劬鸵M(jìn)行污染治理,治理要成本,結(jié)果你和別人共享同樣的環(huán)境,你的效用相對(duì)他人較低,因此你不排污你吃虧,結(jié)果大家都排污,這就是n人博弈的囚徒困境。

二、政府與用水單位之間的博弈

政府代表供水單位,此為水量博弈。我國(guó)長(zhǎng)期以來(lái)對(duì)耗水大的單位,供水無(wú)限量且價(jià)格低廉,導(dǎo)致大家缺乏節(jié)水動(dòng)力。為了達(dá)到水資源的最優(yōu)配置,對(duì)供水與用水單位之間進(jìn)行博弈分析。該博弈的三要素是:博弈參與人集合:{政府,用水單位};政府的策略集是:供水多,供水少,用水單位的策略集是:節(jié)約水,不節(jié)水;設(shè)參與人的收益如圖2所示:

圖2 供水與節(jié)水之間博弈

當(dāng)政府的策略是供水多時(shí),用水單位采取的最優(yōu)策略是不節(jié)水,由圖2可知由于15>12;當(dāng)給定用水單位不節(jié)水時(shí),政府的最優(yōu)策略是供水少,收益為6;當(dāng)給定政府供水少時(shí),用水單位的最優(yōu)策略是節(jié)水,收益選擇為10;當(dāng)給定用水單位節(jié)水時(shí),政府的最優(yōu)策略是供水多因?yàn)?5>3,此博弈不存在納什均衡。在這種情況下,政府如采用水權(quán)交易能收效甚大,與用水單位交易,用量多的需花大成本購(gòu)買(mǎi)大的用水權(quán),這就促使用水多的單位節(jié)約用水以節(jié)約成本。為此生產(chǎn)用水價(jià)位要高,而生活用水要低;將用水量分若干檔次水價(jià),按不同檔次由低到高遞增計(jì)價(jià);夏天與冬天應(yīng)按不同水價(jià)計(jì)費(fèi),目的也是促進(jìn)節(jié)約用水;洗用水做到達(dá)標(biāo)排放,這樣可循環(huán)用水,也可避免污染水環(huán)境,其治理費(fèi)用要計(jì)入水廠(chǎng)成本中,通過(guò)上述措施達(dá)到水資源的最優(yōu)配置。

三、政府與廠(chǎng)商之間博弈分析

1.府與廠(chǎng)商之間的不完全信息動(dòng)態(tài)博弈

廠(chǎng)商一般比較清楚政府各次制定的環(huán)保法規(guī)等,但政府很難了解廠(chǎng)商的執(zhí)行情況,即信息不對(duì)稱(chēng)。此外,短期內(nèi)環(huán)境改善或污染的損益不易表現(xiàn)并很難計(jì)量。因此,廠(chǎng)商與政府就形成了一個(gè)不完全信息動(dòng)態(tài)博弈。將有關(guān)廠(chǎng)商看作廠(chǎng)商A,而政府為B,就構(gòu)成了兩個(gè)博弈方的動(dòng)態(tài)博弈。圖3表示政府與廠(chǎng)商之間的子博弈,p1、p2、p1 、p2′、q1、q2指博弈方選擇對(duì)應(yīng)策略的概率,對(duì)方很難準(zhǔn)確把握,(u、v)指A、B博弈方得益。在此博弈中,如果p1=1,p2=0,那么博弈提前結(jié)束,等到人們對(duì)環(huán)境質(zhì)量有更高要求時(shí),政府又開(kāi)始制定新環(huán)保法規(guī),博弈又開(kāi)始,環(huán)境質(zhì)量將得到不斷改善。但政府管制對(duì)于廠(chǎng)商來(lái)說(shuō)是一種威脅,如果q1>q2,則它是可信的威脅,那么廠(chǎng)商在上階段很可能選擇不違規(guī),即p1>p2;反之q2>q1,博弈繼續(xù)向下進(jìn)行,環(huán)

境向著惡性發(fā)展。目前我國(guó)的環(huán)保法規(guī)不夠嚴(yán)厲,即使上交罰金,仍有高額暴利,因此政府的法規(guī)只是一種不可信“威脅”。

圖3 政府與廠(chǎng)商之間的動(dòng)態(tài)子博弈

2.政府與廠(chǎng)商之間的靜態(tài)博弈

此博弈中,政府的選擇是打擊與不打擊,廠(chǎng)商的選擇為合理與不合理排污。這是一個(gè)靜態(tài)博弈,其支付矩陣如圖4:其中a,b分別為廠(chǎng)商合理排污的概率、政府打擊廠(chǎng)商違法排污行為的概率,A為廠(chǎng)商合理排污的成本,C為政府打擊違法排污行為的成本,F(xiàn)是廠(chǎng)商不合理排污時(shí)被政府發(fā)現(xiàn)后的罰款。給定a,政府選擇打擊與不打擊的期望收益分別為(G為政府,Q為廠(chǎng)商):

圖4 政府與廠(chǎng)商之間的靜態(tài)博弈

G(1,a)=C*a+(F-C)*(1a); G(0,a)=0,解 G(1,a)= G(0,a)= 0,得a*=(FC)/F。即:若廠(chǎng)商合理排污的概率大于(FC)/F,政府最優(yōu)選擇是不打擊;否則反之。給定b,廠(chǎng)商選擇合理與不合理排污的期望收益分別為: Q(b,1)=A*b+(-A)*(1b); Q(b,0)=(FA)*b,解 Q(b,1)= Q(b,0)=0,得b*=A/(A+F)。若政府打擊違法排污行為的概率小于A/(A+F),廠(chǎng)商最優(yōu)選擇是不合理排污;否則反之。因此政府應(yīng)嚴(yán)厲打擊違法排污行為,使政府的打擊行為成為對(duì)廠(chǎng)商不可置疑的威脅,這樣廠(chǎng)商才會(huì)合理排污,而且水質(zhì)和水量之間也是相互影響的,污水資源化,既可減少環(huán)境污染,又能提高水的利用率,增加新的水資源。

四、小結(jié)

廠(chǎng)商共同排污、代表政府的自來(lái)水公司進(jìn)行城市供水、政府與廠(chǎng)商之間的博弈等都是公共水資源問(wèn)題的表現(xiàn)。若使水資源可持續(xù)開(kāi)發(fā)利用,第一,制定合理的排污收費(fèi)制度或?qū)嵭信盼墼S可證交易促使用水單位合理排污,同時(shí)調(diào)整產(chǎn)業(yè)結(jié)構(gòu)及集中治理治污,解決用水緊張以及污染嚴(yán)重等問(wèn)題。第二,政府制定統(tǒng)一合理的水價(jià)或?qū)嵭兴畽?quán)交易使水資源在各用水單位的配置合理,指導(dǎo)自來(lái)水公司之間重組,擴(kuò)大規(guī)模,減少公司數(shù)量,提高效益,同時(shí)節(jié)約水資源。第三,在廠(chǎng)商與政府的動(dòng)態(tài)博弈中,盡量減少政府失靈,制定高額罰款標(biāo)準(zhǔn),嚴(yán)厲的法律制裁及執(zhí)行程序,同時(shí)減少水資源管理中的尋租行為,使之成為該博弈中的可信威脅,使博弈提前結(jié)束。第四,設(shè)計(jì)水資源保護(hù)機(jī)制,怎樣規(guī)則最有效,底價(jià)、投標(biāo)費(fèi)、保證金等定在多少較合理,以使得拍賣(mài)方達(dá)到盈利極大化就是拍賣(mài)形式的機(jī)制設(shè)計(jì)等??傊龅剿Y源開(kāi)發(fā)、利用和保護(hù)協(xié)調(diào)發(fā)展,政府、社會(huì)和公民必須在水資源保護(hù)和利用過(guò)程中,更加開(kāi)闊思路,減少錯(cuò)誤決策,提高行動(dòng)效率,使得博弈各方利益都得到最好的保護(hù),以實(shí)現(xiàn)人與水資源開(kāi)發(fā)利用的和諧發(fā)展。

[1]張維迎.博弈論與信息經(jīng)濟(jì)學(xué)[M].上海:上海人民出版社,1996.

[2]Roger Perman. Natural resource and environment economics [M].second edition , December 1998.

[3]張煥林.探析規(guī)劃水資源論證的政策框架構(gòu)成[J].水利發(fā)展研究,2010(4).

[4]王金南.排污收費(fèi)理論學(xué)[M].北京:中國(guó)環(huán)境科學(xué)出版社,1997.

篇4

關(guān)鍵詞:項(xiàng)目績(jī)效考核;囚徒困境;博弈分析;項(xiàng)目管控模式

Abstract: The existing problems of performance evaluation system in construction enterprises and its improvement methods are analyzed in the perspective of game theory. The modeling of game theory is described by prisoner's dilemma case and is applied in the project performance evaluation of construction enterprises, and the game model of project performance evaluation is proposed. The profit and loss by cooperation and non-cooperation with its strategy adopted is demonstrated both from the side of head office and project team. Improvement strategies such as enhancing the project management and control and increasing the proportion of performance awards of the project team are proposed for the management of project performance evaluation, by analyzing of the model, to maximize the project profits by cooperation of the two sides.

Key words: project performance evaluation;prisoner's dilemma;game theory;project management and control model;

中圖分類(lèi)號(hào): C29 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào):

傳統(tǒng)的建筑企業(yè)采用粗放式項(xiàng)目管控模式,承接到項(xiàng)目后,由建筑公司總部(以下簡(jiǎn)稱(chēng)公司)與項(xiàng)目部簽訂目標(biāo)責(zé)任書(shū),項(xiàng)目實(shí)施的所有權(quán)力移交給項(xiàng)目經(jīng)理,公司作為管理層,一般不參與項(xiàng)目的材料采購(gòu)、分包選擇等工作,工程結(jié)束后,公司根據(jù)目標(biāo)責(zé)任書(shū)對(duì)項(xiàng)目進(jìn)行指標(biāo)考核,收取約定的項(xiàng)目管理費(fèi)用。這種傳統(tǒng)項(xiàng)目管控模式存在的問(wèn)題有:公司缺少對(duì)項(xiàng)目的深度控制權(quán),卻要承擔(dān)成本、質(zhì)量和安全等風(fēng)險(xiǎn),責(zé)權(quán)利不匹配;公司沒(méi)有對(duì)項(xiàng)目部管理團(tuán)隊(duì)進(jìn)行有效的激勵(lì)和約束,容易形成管理漏洞滋生腐敗,無(wú)法實(shí)現(xiàn)項(xiàng)目利潤(rùn)的最大化。本文從博弈論的角度對(duì)項(xiàng)目績(jī)效考核的管理進(jìn)行了分析,為建筑企業(yè)完善和落實(shí)項(xiàng)目績(jī)效考核體系提供了理論支持和依據(jù)。

1博弈論模型分析

博弈論是雙方在平等的對(duì)局中各自利用對(duì)方的策略變換自身的對(duì)抗策略,從而達(dá)到取勝或者自身利益最大化的目的。假設(shè)有N個(gè)博弈主體參與博弈,給定其他人策略的條件下,每個(gè)局中人選擇自己的最優(yōu)策略,從而使自己利益最大化。所有局中人策略構(gòu)成一個(gè)策略組合。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下,沒(méi)有人有足夠理由打破這種均衡。納什均衡[1]的數(shù)學(xué)定義如下:在博弈G=S1,…,Sn:u1,…,un中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策論組合(s1*,…,sn*)中,任意博弈方i的策論si*,都是對(duì)其余博弈方策略的組合(s1*,…si-1*,si+1*,…,sn*)的最佳對(duì)策,也即ui(s1*,…si-1*,si*,si+1*,…,sn*)≥ui(s1*,…si-1*,sij*,si+1*,…,sn*)對(duì)任意sij∈Si都成立,則稱(chēng)(s1*,…,sn*)為G的一個(gè)納什均衡。納什均衡并不意味著博弈雙方達(dá)到了一個(gè)整體的最優(yōu)狀態(tài),囚徒困境就是一個(gè)著名的例子。

在囚徒困境模型中,假設(shè)有兩個(gè)小偷A(chǔ)和B被警察抓獲,被分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對(duì)每一個(gè)犯罪嫌疑人,警方給出的政策是:如果兩個(gè)犯罪嫌疑人都坦白了罪行,則各被判刑8年;如果一個(gè)犯罪嫌疑人坦白而另一個(gè)人選擇抵賴(lài),則抵賴(lài)者判刑10年,而坦白者立即釋放。如果兩人都抵賴(lài),則警方只能以私入民宅的罪名將兩人各判入獄1年。下表給出了這個(gè)博弈的支付矩陣。

表1 囚徒困境博弈

對(duì)A來(lái)說(shuō),無(wú)論B作何選擇,他選擇“坦白”總是對(duì)自己最優(yōu)的。而同理B也會(huì)選擇“坦白”,結(jié)果是兩人都被判刑8年。但是,倘若他們都選擇“抵賴(lài)”,每人只被判刑1年。表1中的四種行動(dòng)選擇組合中,(抵賴(lài)、抵賴(lài))是帕累托最優(yōu)的,因?yàn)槠x這個(gè)行動(dòng)選擇組合的任何其他行動(dòng)選擇組合都至少會(huì)使一個(gè)人的境況變差。不難看出,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白,坦白)是一個(gè)占優(yōu)戰(zhàn)略均衡。

2模型在項(xiàng)目績(jī)效考核中的應(yīng)用

公司和項(xiàng)目部是兩個(gè)相對(duì)對(duì)立的博弈主體,公司具有行政和資源優(yōu)勢(shì),可以向項(xiàng)目部下達(dá)行政和管理指令,同時(shí)掌控項(xiàng)目部的部分資源,而項(xiàng)目部也擁有一定的自,具備現(xiàn)場(chǎng)管理優(yōu)勢(shì)。雙方主要博弈的目標(biāo)是項(xiàng)目的潛在收益,公司希望獲得更大的項(xiàng)目總收益,而項(xiàng)目部則有可能通過(guò)轉(zhuǎn)移或犧牲潛在收益來(lái)增加個(gè)人收入[2]。

假設(shè)實(shí)施某項(xiàng)目的過(guò)程中公司的基準(zhǔn)收益是A,項(xiàng)目部收益為B(固定工資收入),項(xiàng)目潛在收益為C(其中公司通過(guò)加強(qiáng)管控可得到的潛在收益為C1,項(xiàng)目部可操控的潛在收益為C2,C=C1+C2),公司與項(xiàng)目部簽訂的管理費(fèi)指標(biāo)為D,獎(jiǎng)勵(lì)的指標(biāo)為κ(C-D),若公司實(shí)現(xiàn)績(jī)效考核則獎(jiǎng)勵(lì)給項(xiàng)目部的比例系數(shù)為η(0

篇5

關(guān)鍵詞:組織沖突;博弈論;最優(yōu)沖突管理;Morgan模式

一、前言

全球化和戰(zhàn)略聯(lián)盟使得行政管理過(guò)程中的壓力和資源重新配置問(wèn)題劇增。技術(shù)壓力在組織內(nèi)外產(chǎn)生了諸如喪失隱私、信息泛濫、缺乏面對(duì)面溝通、技能窘迫或知識(shí)匱乏得不到晉升等等方面的問(wèn)題。企業(yè)龐大的集中控制的組織隨之與分散的、變幻莫測(cè)的市場(chǎng)之間的沖突愈加頻繁。這些發(fā)生在組織結(jié)構(gòu)內(nèi)部和戰(zhàn)略層面之間的沖突,極大地影響組織的決策。

(一)國(guó)內(nèi)外理論進(jìn)展

現(xiàn)代管理科學(xué)對(duì)沖突的研究源于20世紀(jì)60年代,巴納德和西蒙都認(rèn)為組織沖突長(zhǎng)存企業(yè)內(nèi)部?!霸谝粋€(gè)大型組織里要所有人為其自身的個(gè)人利益工作而采取合作的方式不大可能?!盝•klly,H•Assael都認(rèn)為,組織中存在沖突對(duì)促進(jìn)目標(biāo)顯露有積極作用。之后對(duì)組織沖突產(chǎn)生原因及處理研究開(kāi)始獲得進(jìn)展,學(xué)者們開(kāi)始發(fā)現(xiàn)壓制沖突的傳統(tǒng)管理思維和方法的不合理性。LouisR•Pondy認(rèn)為,壓制沖突的組織剝奪了自我調(diào)節(jié)和穩(wěn)定成長(zhǎng)的功能。60年代后,在組織管理和行為理論的研究中,都把沖突管理作為一項(xiàng)重要內(nèi)容加以關(guān)注。如RossA•Mebber于70年代完成的《組織理論管理》、GaryJohns的《組織行為學(xué)》、Derslergary的《組織管理》和JohnM.Ivancevich和MechaelT.Martteson的《組織行為與管理》等著作,都對(duì)沖突的性質(zhì)和形成原因、影響解決沖突問(wèn)題的因素和解決沖突問(wèn)題的途徑等進(jìn)行了較系統(tǒng)的研究。

相比西方管理學(xué)者的研究,國(guó)內(nèi)管理學(xué)界對(duì)企業(yè)或其他組織沖突的研究尚處于起步階段,80年代后期港臺(tái)學(xué)者開(kāi)始相關(guān)研究,從創(chuàng)新角度得出了一些具有時(shí)代特征的觀(guān)點(diǎn)。如“缺乏沖突的團(tuán)體容易陷入群體思考模式的陷阱?!薄捌髽I(yè)領(lǐng)導(dǎo)應(yīng)該刻意維持良性沖突的產(chǎn)生,利用沖突激勵(lì)組織進(jìn)步?!钡鹊?。賴(lài)明正對(duì)組織變革中利益沖突和組織學(xué)習(xí)之間的關(guān)系進(jìn)行了實(shí)證研究,提出在追求競(jìng)爭(zhēng)力提升的同時(shí),原先企業(yè)內(nèi)利益均衡的態(tài)勢(shì)也隨著組織的變革而有所不同。胡文琦、范慶玉從分銷(xiāo)渠道的角度對(duì)沖突關(guān)系進(jìn)行了分析;張繼征對(duì)企業(yè)轉(zhuǎn)包過(guò)程中的沖突行為進(jìn)行了評(píng)價(jià)并提出解決方法;張勇、張玉中分析了企業(yè)組織間沖突策略選擇的影響因素;李霄、徐中和則利用博弈論對(duì)沖突管理的策略方法進(jìn)行了推演等等。

(二)對(duì)沖突理論演進(jìn)的簡(jiǎn)要評(píng)述

沖突(conflict)是指兩個(gè)或更多相關(guān)聯(lián)的主體,因互動(dòng)行為所導(dǎo)致不和諧的狀態(tài)。是個(gè)體對(duì)外部環(huán)境做出的過(guò)激反應(yīng),體現(xiàn)了決策意愿的個(gè)人化。

按照西方?jīng)_突理論,沖突過(guò)程一般分為五個(gè)階段,即潛在的對(duì)立或不一致、認(rèn)知和個(gè)性、行為意向、行為和結(jié)果。第一階段也稱(chēng)為沖突的成因,一般概括為三類(lèi):溝通、結(jié)構(gòu)和個(gè)人因素。認(rèn)知和個(gè)性化階段是指?jìng)€(gè)體對(duì)沖突有知覺(jué)存在,并且個(gè)體有了情感上的投入。行為意向介于一個(gè)人的認(rèn)知、情感和外顯行為之間,它指的是從事某種特定行為的決策。行為階段則是沖突雙方公開(kāi)地試圖實(shí)現(xiàn)各自的愿望。結(jié)果階段就是沖突對(duì)組織績(jī)效影響的最后結(jié)果,即是功能正常還是功能失調(diào)的結(jié)果。激發(fā)功能正常的沖突是沖突管理的一項(xiàng)重要內(nèi)容,當(dāng)沖突出現(xiàn)的時(shí)候談判是解決沖突比較好的辦法。

組織內(nèi)部成員之間面對(duì)一定的環(huán)境條件,在一定的規(guī)則下,同時(shí)或先后,依次或多次,從各自允許的行為或策略中進(jìn)行選擇并加以實(shí)施,并從中各自取得相應(yīng)成果的過(guò)程構(gòu)成了博弈論決策個(gè)體的特征。發(fā)生在組織內(nèi)部的沖突則是由對(duì)立的目標(biāo)、態(tài)度、行動(dòng)所導(dǎo)致的組織內(nèi)部或組織間的非合作博弈行為。本文試圖引入博弈論觀(guān)點(diǎn),對(duì)給定理性局中人即組織成員在沖突中通過(guò)其最優(yōu)選擇追求個(gè)人效用最大化,最終達(dá)到博弈均衡的現(xiàn)象加以文本解釋?zhuān)瑢ふ覜_突管理各方合理策略下博弈的解,從而建立最優(yōu)沖突管理方案。

二、織內(nèi)沖突的博弈特征

使用嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)模型研究沖突對(duì)抗條件下最優(yōu)決策問(wèn)題的理論稱(chēng)博弈論。如果一個(gè)博弈存在一個(gè)戰(zhàn)略組合,任何參與人要改變這一戰(zhàn)略組合都可能導(dǎo)致降低自身的效用水平(或只能保持原有的效用水平),因而任何參與人都沒(méi)有積極去改變這一戰(zhàn)略組合,這一戰(zhàn)略組合稱(chēng)為該博弈的納什均衡。沖突之所以發(fā)生可能是利益相關(guān)者(stakeholder)對(duì)若干議題的認(rèn)知、看法不同,需要、利益不同,或是基本道德觀(guān)、不同等因素所致。

沖突發(fā)生在復(fù)雜的組織內(nèi)部,存在組織戰(zhàn)略行為中的沖突加劇了博弈頻次。Libby認(rèn)為,組織是成員之間存在心理上相互依存關(guān)系的非簡(jiǎn)單個(gè)人集聚。組織具有相互依存、協(xié)作、分工和權(quán)威階層的特征。[1,2]博弈論中的決策個(gè)體與微觀(guān)經(jīng)濟(jì)學(xué)中的個(gè)體決策相比,博弈中的決策是相互依存的,即考慮了各個(gè)決策個(gè)體之間的相互影響。

基于事物矛盾性的認(rèn)識(shí),組織沖突假設(shè)辨證表現(xiàn)在:(1)沖突是不可避免的;(2)沖突對(duì)變化而言是不可或缺的要素;(3)只要對(duì)沖突進(jìn)行很好的管理,其對(duì)全局效用的促進(jìn)是正相關(guān)的;(4)充分利用沖突為對(duì)于集團(tuán)組織結(jié)構(gòu)和戰(zhàn)略目標(biāo)實(shí)現(xiàn)是有利的。沖突使組織內(nèi)部產(chǎn)生了問(wèn)題,但也為組織興奮提供了必要的激勵(lì)條件。在組織沖突中,決策個(gè)體不僅依賴(lài)于自己的選擇,而且依賴(lài)于其他決策個(gè)體的選擇,各個(gè)決策個(gè)體之間的相互影響在博弈決策中被充分考慮,個(gè)體的效用函數(shù)不僅依賴(lài)于自己的選擇,而且依賴(lài)于其他決策個(gè)體的選擇,個(gè)體最優(yōu)決策μi(S),是他人效用函數(shù)的函數(shù)μ3i(S)=μ(μ1(S),μ2(S),…,μi-1(S)μ,μi+1(S)μ,…,μn(S))(設(shè)i為博弈中的局中人,i=1,2,…,n;si表示局中人i的策略,S=(s1,s2,…,sn)表示n個(gè)局中人的決策向量,μi(S)記為局中人i的效用函數(shù)。從一定意義上講,博弈論研究的是存在相互外部性條件下的個(gè)體決策問(wèn)題,組織沖突同樣是一次或多次相同外部條件下個(gè)體與個(gè)體、個(gè)體與組織、組織與外部環(huán)境間博弈的最優(yōu)策略選擇。[3]

三、一般性組織內(nèi)沖突的原因及影響

Creighton,Moore,Amy,Bisno分別探討沖突的根本原因,并歸納為:(1)程序沖突(proceduralconflict)。流程上發(fā)生問(wèn)題,在責(zé)任權(quán)限模糊時(shí)可能發(fā)生角色沖突。[4](2)資料或資訊沖突(dataorinformationconflict)。爭(zhēng)奪稀缺資源引發(fā)沖突。(3)價(jià)值判斷沖突(valueconflict)。隨著組織不斷擴(kuò)大,交流機(jī)會(huì)和次數(shù)減少,成員對(duì)所在組織的歸屬意識(shí)得以增強(qiáng),組織內(nèi)競(jìng)爭(zhēng)和文化相斥成為沖突的原因。(4)利益沖突(interestconflict)。報(bào)酬體系公平性導(dǎo)致的沖突。感覺(jué)到報(bào)酬體系中存在著不公平或發(fā)生偏離的情況,小集團(tuán)間或人際關(guān)系上可能出現(xiàn)沖突。(5)關(guān)系沖突(relationshipconflict)。工作中的依賴(lài)關(guān)系導(dǎo)致的沖突。(6)情緒沖突(emotionconflict)。源于心理承受力、能力差異導(dǎo)致的沖突。研究和掌握容易導(dǎo)致沖突的原因的考慮方法,比防止非生產(chǎn)性沖突發(fā)生或者把非生產(chǎn)性沖突限制在最小化范圍內(nèi)更重要。

沖突結(jié)果是長(zhǎng)程的,回避沖突和掩蓋沖突同樣能導(dǎo)致消極和懈怠的狀態(tài)產(chǎn)生。Kast和Rosenzweig即強(qiáng)調(diào)不應(yīng)忽視沖突在促進(jìn)改革的積極的角色與功能。而沖突管理則是以系統(tǒng)、科學(xué)的方式來(lái)消除認(rèn)知與價(jià)值差異等障礙,以達(dá)成協(xié)議的過(guò)程。其目的在沖突過(guò)程中減少可能的或是不必要的傷害,以促進(jìn)有利沖突雙方的結(jié)果。[5]沖突管理的目的也是在均衡博弈不利于解決沖突困局情況下,采取合作態(tài)度尋求最優(yōu)解。

四、組織內(nèi)沖突管理——對(duì)Morgan模式的一個(gè)博弈理解

運(yùn)用博弈觀(guān)點(diǎn)闡釋組織沖突管理的難點(diǎn)就在于局中人所參與的每次博弈或多次博弈的得益。理人往往從自身最優(yōu)策略選擇出發(fā)以實(shí)現(xiàn)自身利益為目標(biāo)參與博弈。

(一)Morgan的五種選擇

GarethMorgan在其《組織印象》(I(xiàn)magesofOrganization)中,說(shuō)明在組織管理者在面臨沖突時(shí),可進(jìn)行的五種模式選擇(見(jiàn)圖1)。沖突的消除從自我主張與協(xié)調(diào)性?xún)删S度考慮。自我主張性是指當(dāng)事人使自身利益關(guān)系得到滿(mǎn)足的意圖;而協(xié)調(diào)性則是使他人的利害關(guān)系得到滿(mǎn)足。據(jù)此可以把解決沖突的方法分為五類(lèi):(1)強(qiáng)制型:為利益堅(jiān)持競(jìng)爭(zhēng),并以自身最優(yōu)策略完全實(shí)現(xiàn)為目的,顯示威力和強(qiáng)制力;(2)和解型:放棄自身利益做出讓步,重視雙方關(guān)系維持而不是競(jìng)爭(zhēng),也許不得已唯命是從;(3)回避型:雙方都不輕易將其真實(shí)意愿外露的對(duì)策,沒(méi)有信息交換;(4)姑息型:相互妥協(xié)處理沖突,即與其唯命是從,不如擇機(jī)達(dá)成共識(shí);(5)合作型:完全理性行動(dòng),基于充分合作雙方共同決定尋找最優(yōu)策略并采取行動(dòng)。合作通常被視為解決沖突的最佳方案。

Morgan解決模式構(gòu)成了非合作博弈的條件。博弈的過(guò)程就是各個(gè)理性的博弈方(當(dāng)事人)選擇自己決策的過(guò)程,當(dāng)各博弈方都不愿或不會(huì)單獨(dú)改變自己策略的策略組合存在時(shí),或者說(shuō)為了極大化自己的盈利(或效用),每一個(gè)局中人所采取的策略一定應(yīng)該是關(guān)于其他局中人所取策略的最佳反應(yīng)。[6]納什均衡說(shuō)明沖突管理也必須符合這樣的規(guī)律:按照你愿意別人對(duì)待你的方式來(lái)對(duì)待別人,但只有基于他們也必須按同樣方式行事。

(二)沖突博弈的困境解釋

現(xiàn)實(shí)組織內(nèi)沖突發(fā)生時(shí)由于缺乏互釋的溝通,當(dāng)事人雙方處于對(duì)立面時(shí)必然表現(xiàn)為一種“囚徒的兩難選擇”。困境中每一方在選擇策略時(shí)都沒(méi)有“共謀”,他們只是選擇對(duì)自己最有利的策略,而不考慮組織福利或任何其他對(duì)手的利益。也就是說(shuō),這種策略組合由所有參與人的最佳策略組合構(gòu)成。沒(méi)有人會(huì)主動(dòng)改變自己的策略以便使自己獲得更大利益。個(gè)人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對(duì)所有人都不利的結(jié)局。[7]雙方在合作與抵制策略上首先想到自己,這樣他們必然要陷入回避。只有當(dāng)他們都首先替對(duì)方著想,或者相互合謀時(shí),才可以得到最完美的和解。

組織內(nèi)集團(tuán)利益沖突中,局中人心態(tài)構(gòu)成博弈困境。前者希望沖突解決以部門(mén)利益最大化為終極目標(biāo),后者想打破這樣的均勢(shì),博弈的結(jié)果可能出現(xiàn)Morgan模式,諸如強(qiáng)制推行,單方和解,雙方逃避或相互妥協(xié)幾種解決方案。那么通過(guò)怎樣的渠道才能在沖突人之間建立合作的基礎(chǔ),使局中人一定程度上能夠站在對(duì)方的視角考慮問(wèn)題,從而走出囚徒困境,最大化實(shí)現(xiàn)雙方利益。而客觀(guān)上,正當(dāng)?shù)闹鹄膽B(tài)構(gòu)成了人們正常與主要的行為動(dòng)機(jī)。當(dāng)沖突管理試圖通過(guò)法律或者道德維系良好的社會(huì)秩序時(shí),必須正視這種心態(tài)在各種博弈過(guò)程的深刻影響與具體作用。

(三)最優(yōu)沖突管理——強(qiáng)制下民主配合制度創(chuàng)新

組織沖突多是個(gè)人目標(biāo)實(shí)現(xiàn)與組織強(qiáng)調(diào)經(jīng)濟(jì)決策者的個(gè)人理性,強(qiáng)調(diào)不完全信息、不完全競(jìng)爭(zhēng)條件下的經(jīng)濟(jì)分析,強(qiáng)調(diào)決策個(gè)體之間的相互影響和相互作用等外部性,強(qiáng)調(diào)通過(guò)規(guī)則、機(jī)制和制度的設(shè)計(jì)和優(yōu)化在個(gè)人理性得到滿(mǎn)足的基礎(chǔ)上達(dá)到個(gè)人理性和集體理性的一致。根據(jù)有關(guān)沖突的研究,無(wú)論是業(yè)績(jī)優(yōu)異的公司管理者,還是業(yè)績(jī)差的公司管理者,解決沖突的考慮首先均為合作型。然而次優(yōu)方案的選擇就差異很大,前者多采取強(qiáng)制姿態(tài),而后者多采取姑息對(duì)策,由此可以導(dǎo)出最為有效地解決沖突的方法是強(qiáng)制的并以合作型為支持。由于合作型是采取基于民主解決問(wèn)題的開(kāi)放交流形式,可以說(shuō)強(qiáng)制力下并給予民主的行動(dòng)是解決沖突的最為有效的方法。[8]這也說(shuō)明經(jīng)濟(jì)的博弈均衡并不一定是帕雷托最優(yōu)的,個(gè)人理性和集體理性可能存在著矛盾和沖突,對(duì)于這種矛盾和沖突,不在于否定個(gè)人理性,關(guān)鍵是通過(guò)設(shè)計(jì)一種制度的創(chuàng)新,建立起一種新的使得在滿(mǎn)足個(gè)人理性的基礎(chǔ)上能夠達(dá)到集體理性的機(jī)制。

Rummel認(rèn)為沖突過(guò)程從平衡與不平衡中間移動(dòng),達(dá)成一種平衡。同時(shí)沖突關(guān)聯(lián)利益人的關(guān)系也未必是全然相互競(jìng)爭(zhēng)的,在運(yùn)用沖突管理的原則與方法時(shí),反而通常存在競(jìng)爭(zhēng)與合作的混合關(guān)系,貫穿如:(1)對(duì)事(或問(wèn)題)不對(duì)人;(2)重視利益而非堅(jiān)守立場(chǎng);(3)尋求互利的方案;(4)兼顧主、客觀(guān)評(píng)估標(biāo)準(zhǔn)等態(tài)度,追求整合協(xié)商談判(integrativebargaining),所謂的雙贏(win-win)才有機(jī)會(huì)。[4]但納什均衡博弈論由于僅關(guān)注個(gè)體行為的合理性。不可避免的是它在解決組織沖突中的局限性,博弈論描繪出困境,卻難以解決困境。納什均衡博弈論也不能從根本上保護(hù)博弈各方的利益,博弈不能帶來(lái)共贏,卻可能造成共輸(simultaneity-loss)。[9]

參考文獻(xiàn):

[1]DEBORAHM.KOLB,JUDITHWILLIAMS.Breakthroughbargaining[M].HarvardBussinessReview,2001:89~97.

[2]STEPENIEOVERMAN.Makefamily-friendlyinitiativesfly[M].HRFocus,1999:14.

[3]莫燕,周建中.基于博弈論的企業(yè)技術(shù)創(chuàng)新對(duì)策研究[J].技術(shù)經(jīng)濟(jì)2002(7):10-12.

[4]弗雷德•魯森斯.組織行為學(xué)[M].王壘,譯.北京:人民郵電出版社,2004.

[5]汪明生,朱斌妤.沖突管理[M].北京:九州出版社,2001.

[6]劉仁軍.組織沖突的結(jié)構(gòu)因素研究[J].南開(kāi)管理評(píng)論,2001(4):30-33.

[7]張維迎.博弈論和信息經(jīng)濟(jì)學(xué)[M].上海:上海三聯(lián)書(shū)社,上海人民出版社,2002.

篇6

1基站自?xún)?yōu)化系統(tǒng)模型研究

1.1博弈理論博弈論又稱(chēng)為對(duì)策論,包括參與者(player)、策略(strategies)、收益(payoff)等要素,目標(biāo)是找到各參與者間最優(yōu)的策略選擇以及選擇策略時(shí)的博弈結(jié)果、分析這些結(jié)果的數(shù)學(xué)理論和方法。本文采用了協(xié)作博弈的思想,博弈的要素包括:博弈參與者是各小區(qū),策略是子信道上的發(fā)射功率集合,收益是吞吐量。首先引用了凈函數(shù)的概念,凈函數(shù)包括效用函數(shù)和代價(jià)函數(shù)。其中,效用函數(shù)代表一個(gè)小區(qū)的容量,代價(jià)函數(shù)代表需要基站付出的“代價(jià)”。然后模擬最大化多小區(qū)OFDMA系統(tǒng)的總?cè)萘?,最?yōu)化基站能耗的博弈過(guò)程。在該博弈過(guò)程中,每個(gè)小區(qū)的基站獨(dú)立控制本小區(qū)的子信道分配,獨(dú)立地進(jìn)行功率分配,從而最大化本小區(qū)的容量。

1.2效用函數(shù)效用函數(shù)是一個(gè)微觀(guān)經(jīng)濟(jì)學(xué)的概念,用來(lái)表示消費(fèi)者所獲得的收益與消費(fèi)的商品之間數(shù)量關(guān)系。效用函數(shù)應(yīng)用在無(wú)線(xiàn)通信的功率控制問(wèn)題中,通常選取用戶(hù)的信干比γ和發(fā)射功率P作為參數(shù)。當(dāng)發(fā)射功率P固定時(shí),效用函數(shù)Ui是信干比γ的單調(diào)增函數(shù);當(dāng)信干比γ固定時(shí),效用函數(shù)Ui是發(fā)射功率P的單調(diào)減函數(shù);當(dāng)發(fā)射功率趨于無(wú)窮大時(shí),效用函數(shù)值為零;當(dāng)發(fā)射功率趨于零時(shí),效用函數(shù)值為零。因此,能耗博弈的效用函數(shù)表達(dá)式如。

1.3代價(jià)函數(shù)小區(qū)簇內(nèi)每個(gè)小區(qū)都試圖最大化自己的效用函數(shù),從而會(huì)對(duì)小區(qū)簇內(nèi)其他小區(qū)造成影響,因此在博弈過(guò)程中引入了代價(jià)函數(shù)。代價(jià)函數(shù)是指博弈過(guò)程中每個(gè)小區(qū)在提高自身發(fā)射功率的同時(shí),需要付出相應(yīng)的“代價(jià)”。引入代價(jià)函數(shù)可對(duì)發(fā)射功率進(jìn)行限制,以達(dá)到降低系統(tǒng)干擾、增加系統(tǒng)整體收益的目的。代價(jià)函數(shù)定義如下。

1.4能耗博弈算法(1)初始化小區(qū)簇內(nèi)各小區(qū)各子信道的發(fā)射功率,即把各小區(qū)的發(fā)射功率平均發(fā)給各個(gè)子信道,此時(shí)的子信道發(fā)射功率為P(0)。定義一個(gè)計(jì)算精度t,設(shè)置為0.1,設(shè)置一個(gè)更新次數(shù)n。(2)各個(gè)小區(qū)的子信道更新自身的發(fā)射功率。對(duì)于第n次功率更新的功率為P(n),第(n-1)次更新為(3)當(dāng)|P(n)-P(n-1)|<t,即功率收斂,找出U(n)中最大的凈函數(shù)Umax(n),認(rèn)為此時(shí)的功率為最優(yōu)功率,否則返回步驟(2)繼續(xù)執(zhí)行。(4)累加每個(gè)小區(qū)各信道的發(fā)射功率,得出每個(gè)小區(qū)的發(fā)射功率。算法流程圖如圖1所示。

2節(jié)能模塊實(shí)現(xiàn)方案

基于上文提出的LTE網(wǎng)絡(luò)基站自?xún)?yōu)化的節(jié)能方法,可在基站增加節(jié)能模塊裝置,實(shí)現(xiàn)基站的自?xún)?yōu)化節(jié)能。節(jié)能模塊原理圖如圖2所示。在基站的主控板上增加能耗博弈模塊,該模塊包括定時(shí)器、信息采集模塊、SNR處理模塊、功率處理模塊等。模塊的工作流程如下:(1)通過(guò)定時(shí)器在設(shè)置時(shí)間周期內(nèi)對(duì)網(wǎng)管下達(dá)指令,要求發(fā)送本小區(qū)和小區(qū)簇內(nèi)鄰小區(qū)的檢測(cè)數(shù)據(jù)包。(2)信息采集模塊根據(jù)檢測(cè)數(shù)據(jù)包采集本小區(qū)和相鄰小區(qū)的發(fā)射功率以及路徑損耗等數(shù)據(jù)信息。(3)SNR處理模塊根據(jù)數(shù)據(jù)信息計(jì)算小區(qū)的信干比。(4)功率處理模塊根據(jù)信干比、數(shù)據(jù)信息等數(shù)據(jù)代入凈函數(shù),循環(huán)進(jìn)行能耗博弈運(yùn)算,最終得到函數(shù)收斂時(shí)的最優(yōu)發(fā)射功率,并根據(jù)結(jié)果實(shí)時(shí)調(diào)整該基站小區(qū)的發(fā)射功率。

3實(shí)驗(yàn)室仿真測(cè)試

針對(duì)基于博弈論的LTE基站自?xún)?yōu)化節(jié)能方法,筆者在實(shí)驗(yàn)室開(kāi)展了詳細(xì)的測(cè)試研究工作,主要驗(yàn)證技術(shù)可行性及節(jié)能效果。本文采用的仿真模型:系統(tǒng)帶寬為10MHz,子載波帶寬為15kHz,則子載波數(shù)為600個(gè),假設(shè)每25個(gè)子載波組成1個(gè)子信道,則系統(tǒng)共有24個(gè)子信道,小區(qū)簇內(nèi)每基站3小區(qū),每小區(qū)均勻分布5個(gè)用戶(hù)。仿真參數(shù)具體如表1所示。圖3為系統(tǒng)模型在不同定價(jià)因子下獲得的系統(tǒng)總吞吐量仿真結(jié)果。由圖3可知,當(dāng)定價(jià)因子為0時(shí),則代價(jià)函數(shù)為0,此時(shí)系統(tǒng)的凈函數(shù)即為效用函數(shù),系統(tǒng)的吞吐量為滿(mǎn)功率發(fā)射時(shí)的吞吐量;定價(jià)因子越小,系統(tǒng)干擾就越大,系統(tǒng)吞吐量也越低;反之亦然。綜合測(cè)試數(shù)據(jù),該算法與傳統(tǒng)的系統(tǒng)最大功率發(fā)射相比,系統(tǒng)總體容量可提高1.23%。在不同定價(jià)因子的情況下,系統(tǒng)的能耗也有差別。圖4為在不同定價(jià)因子下的小區(qū)平均功率仿真結(jié)果。當(dāng)定價(jià)因子取值較小時(shí),系統(tǒng)收斂到一個(gè)較大的功率值;當(dāng)定價(jià)因子取值較大時(shí),則功率較??;當(dāng)定價(jià)因子為0時(shí),小區(qū)平均功率最大。綜合以上結(jié)果可得到最佳的定價(jià)因子,使得系統(tǒng)的吞吐量和發(fā)射功率達(dá)到博弈的最優(yōu)配置。從以上仿真可知,在最高功耗與最優(yōu)功耗對(duì)比中,最優(yōu)功耗的功率比最高功耗低30%,系統(tǒng)吞吐量提升1.23%,該方法能在降低功耗的同時(shí)保證系統(tǒng)的吞吐量,具體如圖5和圖6所示。

4結(jié)束語(yǔ)

篇7

關(guān)鍵詞:博弈、納什均衡、帕累托效應(yīng)、垂直營(yíng)銷(xiāo)系統(tǒng)、“囚徒悖論”

最近幾年,隨著企業(yè)之間的競(jìng)爭(zhēng)日益加劇,終端的競(jìng)爭(zhēng)越演越烈,渠道的競(jìng)爭(zhēng)逐漸從最初的諸侯紛爭(zhēng)走向大型集團(tuán)之間的直接對(duì)抗,企業(yè)在這種情況下的渠道戰(zhàn)略必須在充分掌握競(jìng)爭(zhēng)對(duì)手信息和策略的情況下進(jìn)行,渠道成員在沖突與合作的反復(fù)演練中,紛紛結(jié)成一體化的營(yíng)銷(xiāo)系統(tǒng)。這類(lèi)問(wèn)題實(shí)質(zhì)上都可歸結(jié)為博弈問(wèn)題。企業(yè)運(yùn)用博弈論重塑渠道策略將使渠道決策過(guò)程更加合理化。

傳統(tǒng)渠道策略與納什均衡

傳統(tǒng)渠道往往由一群獨(dú)立的廠(chǎng)商、批發(fā)商與零售商所組成,每一成員都是一個(gè)分離的企業(yè)個(gè)體,各自追求自身利潤(rùn)的極大化,渠道中沒(méi)有一個(gè)成員對(duì)其他的成員有絕對(duì)或足夠的控制力,也沒(méi)有一個(gè)正式的機(jī)構(gòu)來(lái)指派角色和解決沖突。在傳統(tǒng)的渠道中,正如美國(guó)的一位學(xué)者曾指出:“在支離破碎的網(wǎng)絡(luò)中松散地排列著生產(chǎn)商、批發(fā)商和零售商,他們?cè)诒3志嚯x的情況下相互討價(jià)還價(jià),談判銷(xiāo)售條件,并且在其它方面自主行事?!?/p>

從博弈論角度看,渠道成員機(jī)會(huì)主義行事,對(duì)個(gè)人收益最大化的追求導(dǎo)致了納什均衡。所謂納什均衡是指博弈論中當(dāng)事人的一組策略,當(dāng)其他參與人的策略既定時(shí),沒(méi)有任何一個(gè)參與人還能改善他或她的支付。也就是說(shuō),給定參與人A的策略,參與人B無(wú)法做得更好;而給定參與人B的策略,A也不能做得更好。納什均衡有時(shí)也稱(chēng)為非合作均衡。

博弈論(gametheory),是研究決策主體的行為發(fā)生直接相互作用時(shí)候的決策以及這種決策的均衡問(wèn)題。即當(dāng)一個(gè)主體的選擇受到其他主體選擇的影響,而且反過(guò)來(lái)影響到其他主體選擇時(shí)的決策問(wèn)題和均衡問(wèn)題。簡(jiǎn)言之,沖突中公共關(guān)系所表現(xiàn)的組織與公眾之間行為的影響和作用,人們之間的利益沖突與一致,競(jìng)爭(zhēng)與合作的平衡,恰恰是博弈論“在給定的約束條件下追求效用最大化”研究模式的充分表達(dá)。

1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予普林斯頓大學(xué)數(shù)學(xué)家約翰,納什(JohnNash),匈牙利裔美籍經(jīng)濟(jì)學(xué)家斯坦福大學(xué)的豪爾紹尼(Harsanyi,J.),德國(guó)經(jīng)濟(jì)學(xué)家澤爾滕(Selten,R.),他們?nèi)藢?duì)博弈論的發(fā)展作出了決定性的貢獻(xiàn)。

博弈論最有名的“囚徒悖論”說(shuō)的是兩個(gè)囚犯的故事。兩個(gè)囚徒一起做壞事,結(jié)果被警察抓獲,分別關(guān)在兩個(gè)獨(dú)立的不能互通信息的牢房里進(jìn)行審訊。在這種情形下,兩個(gè)囚犯都可以做出自己的選擇:或者坦白,或者抵賴(lài)。

無(wú)論A犯B犯都會(huì)馬上意識(shí)到,他根本無(wú)法相信他的同伙不會(huì)向警方提供對(duì)他不利的證據(jù),最終結(jié)果是兩人都選擇坦白,各判5年。其實(shí)。如果兩個(gè)人都抵賴(lài),各判2年,當(dāng)然比都坦白各判5年要好,但這個(gè)帕累托改進(jìn)辦不到。在靜態(tài)的博弈過(guò)程中,由于理性經(jīng)濟(jì)人的機(jī)會(huì)主義傾向,必然是一個(gè)“納什均衡解”。

一個(gè)完整的博弈應(yīng)當(dāng)包括五個(gè)方面的內(nèi)容:第一,博弈的參加者,即博弈過(guò)程中獨(dú)立決策、獨(dú)立承擔(dān)后果的個(gè)人和組織;第二,博弈信息,即博弈者所掌握的對(duì)選擇策略有幫助的情報(bào)資料;第三,博弈方可選擇的全部行為或策略的集合;第四,博弈的次序,即博弈參加者做出策略選擇的先后;第五,博弈方的收益,即各博弈方做出決策選擇后的所得和所失。

在傳統(tǒng)的渠道策略中,渠道成員為相互獨(dú)立的追求個(gè)人利益最大化的個(gè)體,在這里每個(gè)渠道成員都是機(jī)會(huì)主義者。這種個(gè)人收益的最大化必然引起渠道成員的沖突,結(jié)果由于沖突反而導(dǎo)致交易費(fèi)用增加,收益受損。

改善渠道價(jià)值鏈,創(chuàng)造市場(chǎng)的帕累托最優(yōu)

分銷(xiāo)渠道作為產(chǎn)品的所有權(quán)和實(shí)體從生產(chǎn)領(lǐng)域流轉(zhuǎn)到消費(fèi)領(lǐng)域所經(jīng)過(guò)的通道,由所有參與使產(chǎn)品從生產(chǎn)領(lǐng)域向消費(fèi)領(lǐng)域運(yùn)動(dòng)的組織和個(gè)人所組成,主要包括生產(chǎn)者、批發(fā)商、零售商、商和儲(chǔ)運(yùn)企業(yè)等,甚至還包括消費(fèi)者,它們都是渠道成員。每個(gè)參與者就如同是搏弈論中的局中人,渠道成員的每一營(yíng)銷(xiāo)決策都會(huì)對(duì)其他參與者產(chǎn)生影響,參與者的反應(yīng)反過(guò)來(lái)又會(huì)影響公司的下一步?jīng)Q策,如何決策才能使大家的利益達(dá)到最優(yōu)均衡呢,這正是博弈論所研究的問(wèn)題。要達(dá)到最優(yōu)均衡,渠道成員間必須走向合作,渠道成員間的合作優(yōu)于不合作的解。因?yàn)榫哂泻献飨M牟┺囊?guī)則,允許商討策略,帶有或是不帶有允諾轉(zhuǎn)讓的支付。通過(guò)局中人協(xié)商,所達(dá)成的合作優(yōu)于不合作的解,一般不會(huì)出現(xiàn)最差的結(jié)果。協(xié)商有利于調(diào)整各局中人的利益,而不必將矛盾引發(fā)。

生產(chǎn)者、批發(fā)商和零售商為了相互的利益而進(jìn)行合作,它們通過(guò)一系列的業(yè)務(wù)活動(dòng)相互滿(mǎn)足對(duì)方的需要。同單個(gè)企業(yè)的單獨(dú)活動(dòng)相比,渠道成員合作能為各方帶來(lái)更大的經(jīng)濟(jì)效益。老于世故的公司努力與它們的分銷(xiāo)商建立長(zhǎng)久的關(guān)系,它們清楚地知道它們?cè)谑袌?chǎng)份額、庫(kù)存水平、市場(chǎng)開(kāi)發(fā)、尋找客戶(hù)、技術(shù)建議與支持、市場(chǎng)信息等諸多方面都需要分銷(xiāo)商的合作。

過(guò)去,大多數(shù)廠(chǎng)商認(rèn)為取得中間商的合作問(wèn)題,要采用胡蘿卜加大棒的政策,一方面,提供較高的折扣率、某些優(yōu)惠條件,另一方面,采用制裁措施,威脅減少中間商的利潤(rùn)、推遲交貨、中止關(guān)系等。這種政策的短處是廠(chǎng)商根本不關(guān)心中間商的需要、問(wèn)題、長(zhǎng)處和短處,僅僅依據(jù)單一的刺激一反應(yīng)模式,將眾多的激勵(lì)因素拼湊在一起。現(xiàn)在,渠道成員間的合作開(kāi)始向縱深發(fā)展。如聯(lián)想為了避免渠道成員不穩(wěn)固、松散型的聯(lián)盟關(guān)系,提出了渠道的大聯(lián)想計(jì)劃,把廠(chǎng)商和經(jīng)銷(xiāo)商的關(guān)系提升為一體化的聯(lián)盟關(guān)系。為了保證大聯(lián)想機(jī)制的健全和這一計(jì)劃的不斷推進(jìn),聯(lián)想還建立了一系列的監(jiān)督、保障機(jī)制,成立了專(zhuān)門(mén)的大聯(lián)想顧問(wèn)委員會(huì),大聯(lián)想渠道中的一些重大問(wèn)題、前瞻性問(wèn)題和亟待解決的問(wèn)題都會(huì)在顧問(wèn)委員會(huì)中討論,廠(chǎng)家和商一起來(lái)商量和決定。

一體化的垂直營(yíng)銷(xiāo)系統(tǒng):利益關(guān)系重新洗牌

從中國(guó)最近幾年渠道的發(fā)展趨勢(shì)看,垂直營(yíng)銷(xiāo)系統(tǒng)是渠道博弈演化的一個(gè)必然方向。垂直營(yíng)銷(xiāo)系統(tǒng)(簡(jiǎn)稱(chēng)VMS)的廠(chǎng)商、批發(fā)商和零售商結(jié)為一體,渠道的成員有的同屬一個(gè)公司,有的具有特許權(quán)關(guān)系,有的有足夠的力量使其他的成負(fù)與之合作。垂直營(yíng)銷(xiāo)系統(tǒng)的支配者可以是廠(chǎng)商,也可以是批發(fā)商或零售商。垂直營(yíng)銷(xiāo)系統(tǒng)可以有效地控制成員的行動(dòng),管理渠道成員各自追求其目標(biāo)所發(fā)生的沖突。它可以實(shí)現(xiàn)規(guī)模經(jīng)濟(jì),增加談判力量,避免提供重復(fù)的服務(wù)。

以溫州的企業(yè)為例,最近幾年,無(wú)論是低壓電器、服裝還是皮鞋,基本上都采用了廠(chǎng)商主導(dǎo)型的垂直營(yíng)銷(xiāo)系統(tǒng)。如皮鞋業(yè)“奧康”,從1997年開(kāi)始,就在全國(guó)各省設(shè)立自己的分公司,由總部直接下派人員進(jìn)行供貨與管理,從而建立起強(qiáng)有力的由廠(chǎng)家控制的垂直營(yíng)銷(xiāo)系統(tǒng)。此舉雖然在剛開(kāi)始時(shí)加大營(yíng)銷(xiāo)成本,但能更有效地控制渠道與控制資源,使得奧康幾年來(lái)平穩(wěn)發(fā)展。1998年,奧康在溫州開(kāi)了第一家連鎖專(zhuān)賣(mài)店,爾后在短短的三年中,連鎖專(zhuān)賣(mài)店達(dá)1800多家。這一有效的博弈演化,對(duì)于奧康的獲利與發(fā)展起到了至關(guān)重要的作用。

在藥品行業(yè),這一演化趨勢(shì)同樣明顯,最新的入世談判資料顯示,截止2003年1月1日開(kāi)始,中國(guó)將開(kāi)放藥品分銷(xiāo)服務(wù)體系,允許國(guó)外商業(yè)參與中國(guó)的醫(yī)藥商業(yè)經(jīng)營(yíng),從事采購(gòu)、批發(fā)、倉(cāng)貯、派送、售后服務(wù)等一系列經(jīng)營(yíng)活動(dòng),中國(guó)醫(yī)藥零售商與外資合作來(lái)發(fā)展自己的方向已成定局。在東阿阿膠品牌發(fā)展中,商業(yè)企業(yè)以“東阿阿膠顧問(wèn)團(tuán)”的形式和企業(yè)組成戰(zhàn)略聯(lián)盟,共同促進(jìn)品牌的大發(fā)展;這也是垂直營(yíng)銷(xiāo)系統(tǒng)的一種方式,商業(yè)與企業(yè)之間結(jié)成戰(zhàn)略聯(lián)盟的關(guān)系,互相促進(jìn),互相維護(hù)對(duì)方的經(jīng)濟(jì)利益。

目前,垂直營(yíng)銷(xiāo)系統(tǒng)分為廠(chǎng)商主導(dǎo)型與中間商主導(dǎo)型二種,廠(chǎng)商主導(dǎo)型以汽車(chē)、軟飲料、專(zhuān)利藥品、牙膏、電視機(jī)與照相機(jī)居多。對(duì)這類(lèi)產(chǎn)品來(lái)說(shuō),廠(chǎng)商因財(cái)力上優(yōu)勢(shì)從而在渠道路線(xiàn)中具有支配力量。為了推銷(xiāo)這些產(chǎn)品,單是全國(guó)性的廣告,就花費(fèi)數(shù)百萬(wàn)元。極少有中間商能作如此大的投資。中間商主導(dǎo)型多為家庭用品與時(shí)尚物品,這些產(chǎn)品面對(duì)當(dāng)?shù)厥袌?chǎng)上迅速轉(zhuǎn)變的需求,廠(chǎng)商無(wú)法輕易地預(yù)測(cè)了解當(dāng)?shù)氐男枨笄閯?shì),結(jié)果領(lǐng)導(dǎo)權(quán)就落在中間商手中。大的零售商在近年來(lái)也逐漸開(kāi)始使用這一積極進(jìn)取的營(yíng)銷(xiāo)系統(tǒng)。

參考資料:

《博弈論與信息經(jīng)濟(jì)學(xué)》作者:張維迎上海三聯(lián)書(shū)店《營(yíng)銷(xiāo)管理》作者:菲利普.科特勒上海人民出版社

《營(yíng)銷(xiāo)學(xué)原理》作者:科特勒、阿姆斯特朗

《博弈競(jìng)爭(zhēng)與營(yíng)銷(xiāo)決策》作者:嚴(yán)浩、呂晶《銷(xiāo)售與市場(chǎng)》1997年第十二期

篇8

Abstract: This paper introduces the influence factors such as the electricity suppliers and the transmission and distribution of electricity market, and constructs the marketing evolution game model of A and B, which is a strong selling electricity suppliers and the weak electricity suppliers. Through the use of a variety of different data, the results show that in the transmission and sale of electric power, we must consider the dynamic transmission and distribution in the form of mixed transmission and distribution price to achieve the optimal balance of power market.

P鍵詞: 雙寡頭市場(chǎng);演化博弈;輸配電價(jià);均衡最優(yōu)

Key words: duopoly market;evolutionary game;transmission and distribution;optimal equilibrium

中圖分類(lèi)號(hào):F270.7 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2017)17-0001-04

0 引言

隨著國(guó)家經(jīng)濟(jì)增長(zhǎng)放緩,電力需求進(jìn)入換擋期,售電側(cè)向社會(huì)放開(kāi),各大電力產(chǎn)業(yè)關(guān)聯(lián)公司都紛紛成立售電公司來(lái)應(yīng)對(duì)電力改革形勢(shì)。在打破售電市場(chǎng)壟斷的大前提下,各方如何在利益上達(dá)到最優(yōu)平衡點(diǎn),采取最優(yōu)營(yíng)銷(xiāo)策略是需要研究的重點(diǎn)。目前研究者大多從發(fā)電側(cè)、區(qū)域電能交易、發(fā)電廠(chǎng)競(jìng)價(jià)策略做出深入研究。例如:葉佳明引入的有限理性古諾博弈,提出電力市場(chǎng)有限理性古諾博弈的時(shí)滯后混沌控制方法;張程應(yīng)用演化博弈理論中的多群體復(fù)制動(dòng)態(tài)博弈模型,對(duì)電力公司與發(fā)電廠(chǎng)商競(jìng)價(jià)策略的演化過(guò)程進(jìn)行模擬并研究其演化穩(wěn)定策略。

本文在眾多學(xué)者研究的基礎(chǔ)上,吸取其精華,提出基于古諾-霍特林雙寡頭售電市場(chǎng)競(jìng)爭(zhēng)模型,構(gòu)建強(qiáng)勢(shì)與弱勢(shì)售電商及發(fā)電商的演化博弈模型,分析相關(guān)參數(shù)對(duì)演化博弈結(jié)果的影響,為實(shí)現(xiàn)多方共贏提供理論依據(jù)。

1 古諾-霍特林模型與空間區(qū)位競(jìng)爭(zhēng)理論

古諾模型是由法國(guó)經(jīng)濟(jì)學(xué)家安東尼?奧古斯丁?庫(kù)爾諾于1838年提出的,通常被作為寡頭理論分析的出發(fā)點(diǎn)。古諾模型是一個(gè)只有兩個(gè)寡頭廠(chǎng)商的簡(jiǎn)單模型。該模型假定一種產(chǎn)品市場(chǎng)只有兩個(gè)賣(mài)者,并且相互間沒(méi)有任何勾結(jié)行為,但相互間都知道對(duì)方將怎樣行動(dòng),從而各自怎樣確定最優(yōu)的產(chǎn)量來(lái)實(shí)現(xiàn)利潤(rùn)最大化。該模型闡述了相互競(jìng)爭(zhēng)而沒(méi)有相互協(xié)調(diào)的廠(chǎng)商的產(chǎn)量決策是如何相互作用從而產(chǎn)生一個(gè)位于競(jìng)爭(zhēng)均衡和壟斷均衡之間的結(jié)果。古諾模型的結(jié)論可以很容易地推廣到三個(gè)及以上的寡頭廠(chǎng)商的情況中去。

自古諾模型創(chuàng)建以來(lái),經(jīng)濟(jì)學(xué)界更加關(guān)注寡頭市場(chǎng)競(jìng)爭(zhēng)問(wèn)題。法國(guó)學(xué)者伯川德以?xún)r(jià)格作為決策變量,建立了不同于古諾以產(chǎn)量作為決策變量的寡頭市場(chǎng)競(jìng)爭(zhēng)模型,他認(rèn)為如果同業(yè)中兩家廠(chǎng)商經(jīng)營(yíng)生產(chǎn)成本相同的同種產(chǎn)品,則價(jià)格競(jìng)爭(zhēng)的結(jié)果是每家廠(chǎng)商都按價(jià)格等于邊際成本來(lái)經(jīng)營(yíng),廠(chǎng)商只能獲取正常利潤(rùn),這就是“伯川德均衡”。但這一結(jié)論與現(xiàn)實(shí)并不相符,現(xiàn)實(shí)市場(chǎng)價(jià)格競(jìng)爭(zhēng)的事實(shí)是均衡價(jià)格高于邊際成本,廠(chǎng)商會(huì)獲取超額利潤(rùn)。然而寡頭競(jìng)爭(zhēng)市場(chǎng)無(wú)法達(dá)到“伯川德均衡”。這種現(xiàn)實(shí)市場(chǎng)競(jìng)爭(zhēng)與理論相背離的現(xiàn)象被稱(chēng)為“伯川德悖論”。在對(duì)“伯川德悖論”的理論解釋中,最有代表性的一種是由霍特林開(kāi)創(chuàng)的。他從廠(chǎng)商空間地理區(qū)位以及消費(fèi)者到廠(chǎng)商交通成本差異的角度來(lái)研究“伯川德悖論”,通過(guò)引入廠(chǎng)商在空間區(qū)位上的差異來(lái)將“伯川德悖論”一般化?;籼亓謴膹S(chǎng)商不同空間位置出發(fā),首次建立了一個(gè)線(xiàn)性(直線(xiàn)段)市場(chǎng)上的雙寡頭廠(chǎng)商定位模型。在沒(méi)有價(jià)格競(jìng)爭(zhēng)(每一個(gè)廠(chǎng)商都以邊際成本定價(jià))的情況下,廠(chǎng)商追求利潤(rùn)最大化的結(jié)果就是每一個(gè)廠(chǎng)商都傾向聚集在市場(chǎng)中心,即最小差異原理。因?yàn)樵谝粭l長(zhǎng)度給定的直線(xiàn)上均勻地分布著消費(fèi)者,在這個(gè)市場(chǎng)上兩個(gè)廠(chǎng)商都向消費(fèi)者出售相同的產(chǎn)品,消費(fèi)者到廠(chǎng)商的交通成本是廠(chǎng)商與消費(fèi)者之距離的線(xiàn)性函數(shù),在廠(chǎng)商出售產(chǎn)品價(jià)格相同的條件下,每一個(gè)消費(fèi)者都會(huì)到離自己距離最近的廠(chǎng)商去購(gòu)買(mǎi)產(chǎn)品。廠(chǎng)商之間的競(jìng)爭(zhēng)就變成了如何在既定線(xiàn)段上選擇一個(gè)點(diǎn),使自己所占據(jù)的線(xiàn)段達(dá)到最大化。

霍特林模型的基本假設(shè):

①產(chǎn)品同質(zhì);

②決策變量是價(jià)格;

③消費(fèi)者分布在一條線(xiàn)性的市場(chǎng)上,市場(chǎng)總距離為S公里,每公里有一個(gè)消費(fèi)者,每個(gè)消費(fèi)者購(gòu)買(mǎi)一件商品;

④消費(fèi)者購(gòu)買(mǎi)商品的交通成本與離商店的距離成比例,單位距離的交通成本為t。如圖1所示,寡頭1的位置位于地點(diǎn)A,寡頭2的位置位于地點(diǎn)B,AB為寡頭1和寡頭2需競(jìng)爭(zhēng)的地盤(pán),若最終寡頭1爭(zhēng)奪到的地盤(pán)為AE=x;寡頭2的爭(zhēng)奪到的地盤(pán)為BE=y,則一定有:

S=a+x+y+b (1)

2 基于古諾-霍特林雙寡頭售電市場(chǎng)的競(jìng)爭(zhēng)分析

目前電網(wǎng)電力供銷(xiāo)盈利模式是采用銷(xiāo)售電價(jià)和上網(wǎng)電價(jià)的差值部分作為主要盈利點(diǎn),隨著大用戶(hù)直購(gòu)電的推廣和售電側(cè)放開(kāi)等相關(guān)政策的出臺(tái),未來(lái)電網(wǎng)企業(yè)的收入將主要依靠外部售電公司和發(fā)電企業(yè)交易產(chǎn)生的輸配電價(jià)過(guò)網(wǎng)費(fèi)以及從自身售電業(yè)務(wù)中賺取利潤(rùn)。而電網(wǎng)企業(yè)下屬的售電公司在各大電力企業(yè)成立的售電公司中必將在一定時(shí)期內(nèi)的電力市場(chǎng)中處于強(qiáng)勢(shì)地位(簡(jiǎn)稱(chēng)其公司A),而新興成立的售電商由于售電業(yè)務(wù)以及人才的欠缺等因素相對(duì)比較弱勢(shì)(簡(jiǎn)稱(chēng)其公司B)。發(fā)電商通過(guò)售電商A和售電商B向消費(fèi)者供電。發(fā)電商給予售電商A的上網(wǎng)電價(jià)為P1,而給予售電商B的上網(wǎng)電價(jià)P1+Δp,其中Δp為發(fā)電商的決策變量。

古諾-霍特林模型是假設(shè)存在一個(gè)“線(xiàn)性城市”,城市線(xiàn)性長(zhǎng)度標(biāo)準(zhǔn)化為1,用戶(hù)均勻分布在線(xiàn)性城市[0,1]之間,假設(shè)售電商A在線(xiàn)性城市0端點(diǎn)處,售電商B在線(xiàn)性城市1端點(diǎn)處,兩個(gè)售電商A、B的產(chǎn)品是同質(zhì)的,且兩家企業(yè)同時(shí)決定各自產(chǎn)量。

但考慮實(shí)際購(gòu)售電行為中,售電商A、B要選擇合適的輸配電價(jià)方式,即固定輸配電價(jià)方式M和動(dòng)態(tài)輸配電價(jià)方式F,其中固定輸配電價(jià)方式價(jià)格記為m,其價(jià)格不隨線(xiàn)性城市輸電距離變化而變化,動(dòng)態(tài)輸配電價(jià)方式F為變動(dòng)值,且隨著距離x的變長(zhǎng)而增長(zhǎng)。售電商A、B都是在已知對(duì)方市場(chǎng)份額的情況下,各自確定能夠給自己帶來(lái)最大利潤(rùn)的份額。

討論以下幾種博弈模型:

情形1:售電商A、B均采取動(dòng)態(tài)輸配電價(jià)方式F。

設(shè)售電商A和B的不含輸配電價(jià)費(fèi)用的售電價(jià)格為PA和PB,x表示用戶(hù)距端點(diǎn)0即零售商A的標(biāo)準(zhǔn)化長(zhǎng)度,則用戶(hù)向A或B購(gòu)買(mǎi)電力商品的用電價(jià)格分別為PA+tx和PB+(1-x)t。

設(shè)x1點(diǎn)為用戶(hù)在A和B購(gòu)買(mǎi)電力無(wú)差異位置,則x1點(diǎn)滿(mǎn)足以下條件:

PA+tx1=PB+(1-x1)t (2)

解得:x1=

由(2)式可得強(qiáng)勢(shì)售電商A和弱勢(shì)售電商B的市場(chǎng)份額占比。分布在[0,x1]之間的消費(fèi)者選擇強(qiáng)勢(shì)售電商A,分布在[x1,1]之間的消費(fèi)者選擇向售電商B購(gòu)買(mǎi)產(chǎn)品。因此,售電商A的市場(chǎng)份額為,售電商B的市場(chǎng)份額為1-則售電商A和B的利潤(rùn)函數(shù)分別為:

I=(PA-P1)()(3)

I=(PB-P1-?駐P)(1-)(4)

由最優(yōu)一階條件可知,對(duì)(3)、(4)式中I、I分別求解關(guān)于PA、PB的偏導(dǎo),當(dāng)=0和=0時(shí),得到售電商A和B的最優(yōu)售電價(jià)格分別為

P=t+P1+1/3Δp (5)

P=t+P1+2/3Δp(6)

不失一般性,假設(shè)發(fā)電商的生產(chǎn)成本為0,得到生產(chǎn)上的利潤(rùn)函數(shù)為:

I=P1()+(P1+ΔP)()(7)

對(duì)(7)中的I求解關(guān)于Δp的偏導(dǎo),由最優(yōu)一階條件=0,得此時(shí)發(fā)電商加價(jià)Δp=t,有兩售電商最優(yōu)利潤(rùn)為I=t,I=t

情形2:若售電商A采取固定輸配電價(jià)方式M。售電商B采取動(dòng)態(tài)輸配電價(jià)方式F。

設(shè)x2點(diǎn)為用戶(hù)在A和B購(gòu)買(mǎi)電力無(wú)差異位置,則x2點(diǎn)滿(mǎn)足以下條件:

PA+m=PB+(1-x2)t(8)

解得:x2=

同理,基于(8)式可得售電商A的市場(chǎng)份額為,售電商B的市場(chǎng)份額為1-,則售電商A和B的利潤(rùn)函數(shù)分別為:

I=(PA-P1)()(9)

I=(PB-P1-ΔP)(1-)(10)

由最優(yōu)一階條件可知,對(duì)于(9)、(10)式中I、I分別求解關(guān)于PA、PB的偏導(dǎo),當(dāng)=0和=0時(shí),得到售電商A和B的最優(yōu)售電價(jià)格為:

P=t-m/3+P1+1/3Δp (11)

P=t+m/3+P1+2/3Δp(12)

不失一般性,假設(shè)發(fā)電商的制造成本為0,發(fā)電商的利潤(rùn)函數(shù)為

I=P1()+(P1+ΔP)(1-)(13)

對(duì)(13)中的I求解關(guān)于Δp的偏導(dǎo),當(dāng)最優(yōu)一階條件=0,得出Δp=。I= I=

情形3:若售商B采取固定輸配電價(jià)方式M。售電商A采取動(dòng)態(tài)輸配電價(jià)方式F。

設(shè)x3點(diǎn)為用戶(hù)在A和B購(gòu)買(mǎi)電力無(wú)差異位置,則x3點(diǎn)滿(mǎn)足以下條件

PA+tx3=PB+m(14)

x3=

同理,可得售電商A的市場(chǎng)份額為,售電商B的市場(chǎng)份額占比為1-。

則售電商A和B的利潤(rùn)函數(shù)分別為:

I=(PA-P1)()(15)

I=(PB-P1-?駐P)(1-)(16)

由最優(yōu)一階條件可知,對(duì)于(15)、(16)式中I、I分別求解關(guān)于PA、PB的偏導(dǎo),當(dāng)=0和=0時(shí),得到售電商A和B的最優(yōu)售電價(jià)格為

P3A=(m+t)/3+P1+1/3Δp(17)

P3B=(2t-m)/3+P1+2/3Δp(18)

不失一般性,假設(shè)發(fā)電商的制造成本為0,發(fā)電商的利潤(rùn)函數(shù)為

I=P1()+(P1+ΔP)(1-)(19)

對(duì)(19)式中的I求解關(guān)于Δp的偏導(dǎo),最優(yōu)一階條件=0,得出

Δp=

I= I=

情形4:若售電商A和B均采用固定輸配電價(jià)方式M。

則售電商A和B的利潤(rùn)函數(shù)分別為:

I=(PA-P1)()(20)

I=(PA-P1-ΔP)(1-)(21)

不失一般性,假設(shè)發(fā)電商的制造成本為0,發(fā)電商的利潤(rùn)函數(shù)為

I=P1+ΔP(22)

可以發(fā)現(xiàn),售電商A和B的最優(yōu)價(jià)格都是隨著對(duì)方的價(jià)格的升高而升高,因此不能形成三方均衡均衡博弈,且依賴(lài)于雙方初始收益,這里記初始收益為IrA、IrB。

3 線(xiàn)性電力市場(chǎng)演化競(jìng)爭(zhēng)分析

由于售電商A和B博弈主體具有有限理性,最開(kāi)始選擇的并不一定是最優(yōu),但售電商隨時(shí)間不斷的學(xué)習(xí)和選擇,最終會(huì)確定最優(yōu)的均衡策略。

售電商A和B隨機(jī)獨(dú)立地選取固定輸配電價(jià)和動(dòng)態(tài)輸配電價(jià),并在電力市場(chǎng)中同時(shí)重復(fù)博弈,因此會(huì)在不同的線(xiàn)性城市空間區(qū)域選擇不同的輸配電價(jià)方式,假設(shè)售電商A選擇動(dòng)態(tài)輸配電價(jià)方式F和固定輸配電價(jià)方式M的比例分別為x和1-x,售電商B選擇動(dòng)態(tài)輸配電價(jià)F和固定輸配電價(jià)M的比例為y和1-y,計(jì)算出售電商A策略M和策略F的收益,這里計(jì)收益函數(shù)為I1、I2,最終售電商A和售電商B在自身占有市場(chǎng)內(nèi)選擇輸配電價(jià)的穩(wěn)定博弈狀態(tài)有以下幾種可能狀態(tài):

①A全部選擇固定輸配電價(jià)方式M,B全部選擇動(dòng)態(tài)輸配電價(jià)方式F,記該狀態(tài)為(0,1);

②A全部選擇動(dòng)態(tài)輸配電價(jià)方式F,B全部選擇固定輸配電價(jià)方式M,記該狀態(tài)為(1,0);

③AB都選擇固定輸配電價(jià)方式M,記該狀態(tài)為(0,0);

④AB都選擇動(dòng)態(tài)輸配電價(jià)方式F,記該狀態(tài)為(1,1)。

售電商A和B對(duì)應(yīng)的最終狀態(tài)戰(zhàn)略式如表1所示。

可以得到售電商A的收益為:

I1=txy+x(1-y)+(1-x)y+(1-x)(1-y)IrA(23)

售電商B的收益為:

I2=txy+x(1-y)+(1-x)y+(1-x)(1-y)IrB(24)

兩者動(dòng)態(tài)博弈方程為:

1=x(x-1)[-ty+y-+(1-y)IrA](25)

2=y(y-1)[-tx+x-+(1-x)IrB](26)

對(duì)兩動(dòng)態(tài)方程為0的點(diǎn)進(jìn)行分析,得出:

y=,

x=

我們首先對(duì)售電商A的收益動(dòng)態(tài)博弈方程進(jìn)行分析。

通過(guò)分析,只有在m>>t時(shí),才有y1,所以y

同樣的,對(duì)于售電商B,若x>1,即m>t時(shí),y1=0和y2=1是兩個(gè)穩(wěn)定狀態(tài),其中,y2=1是演化穩(wěn)定的。

若x

令x″=,

當(dāng)x>x″時(shí),y1=0和y2=1是兩個(gè)穩(wěn)定狀態(tài),其中y2=0是演化穩(wěn)定的。當(dāng)x=x″時(shí),所有的y都是穩(wěn)定狀態(tài)。當(dāng)x

把上述售電商A和售電商B競(jìng)爭(zhēng)的復(fù)制動(dòng)態(tài)關(guān)系如圖2和3所示。

從上面圖中可以看出,當(dāng)x>1時(shí),AB售電商僅有(1,1)唯一演化穩(wěn)定狀態(tài),當(dāng)x

若AB售電商兩者初狀態(tài)落在初始區(qū)域S’內(nèi),則最終演化穩(wěn)定狀態(tài)為(1,0),即售電商A采用動(dòng)態(tài)輸配電價(jià)、售電商B采用比最大動(dòng)態(tài)輸配電價(jià)便宜很多的固定輸配電價(jià)(m

4 總結(jié)與展望

本文通過(guò)建立霍特林模型,模擬雙寡頭手電市場(chǎng),應(yīng)用演化博弈理論,考慮了動(dòng)態(tài)輸配電價(jià)和固定輸配電價(jià)兩種情況下,電力市場(chǎng)中發(fā)電商、售電商和輸電費(fèi)用的三者博弈的最優(yōu)演化結(jié)果,通過(guò)分析可以發(fā)現(xiàn)以下結(jié)論:在售電市場(chǎng)放開(kāi)的情況下,存在強(qiáng)勢(shì)售電商、弱勢(shì)售電商和發(fā)電商三者博弈,若對(duì)售電商都采用固定輸配電價(jià)模式,必然不能達(dá)成最優(yōu)納什均衡,因此要培養(yǎng)成型的電力市場(chǎng)(發(fā)電、輸電、售電)競(jìng)爭(zhēng)中必須要考慮靈活輸配電價(jià)形式或者對(duì)于弱勢(shì)售電商采取相對(duì)固定保護(hù)的輸配電價(jià),從而達(dá)到電力市場(chǎng)的均衡最優(yōu)。

因此電網(wǎng)企業(yè)在競(jìng)爭(zhēng)中需要審時(shí)度勢(shì),因地制宜的采取售電營(yíng)銷(xiāo)措施,將自身利益和市場(chǎng)利益的有序結(jié)合,為多方共贏提供理論依據(jù)。在后續(xù)的研究中,將從輸電、發(fā)電、售電三方角度以及應(yīng)用更加實(shí)際的市場(chǎng)模型進(jìn)行分析博弈最優(yōu)理論分析。

參考文獻(xiàn):

[1]葉佳明,吳剛.電力市場(chǎng)有限理性古諾動(dòng)態(tài)博弈的經(jīng)濟(jì)評(píng)價(jià)及其混沌控制[J].陜西電力,2009,4(37):4-6.

[2]金,杜建國(guó),盛昭瀚.區(qū)域環(huán)境保護(hù)行動(dòng)的演化博弈分析[J].系統(tǒng)工程理論與實(shí)踐,2015,12(35):3107-3118.

[3]張程,杜松懷,蘇娟.基于演化博弈的區(qū)域電力市場(chǎng)報(bào)價(jià)策略研究[J]現(xiàn)代電力,2010,2(27:87-90.

[4]張新華,賴(lài)明勇.隨機(jī)需求下電力競(jìng)價(jià)市場(chǎng)演化均衡分析[J].系統(tǒng)工程,2007,25(1):78-82.

[5]吳寧,祖博,吳軍基.演化博弈論在發(fā)電側(cè)電力市場(chǎng)競(jìng)價(jià)中的應(yīng)用[J].2006,華東電力,2006,34(3):35-38.

[6]黃偉,李玟萱,李寧坤,等.基于Bertrand模型的2類(lèi)售電企業(yè)定價(jià)策略[J].電力建設(shè),2016,37(3):76-81.

[7]謝識(shí)予.經(jīng)濟(jì)博弈論[M].上海:復(fù)旦大學(xué)出版社,2002:233-273.

[8]楊洪明,賴(lài)明勇.考慮輸電壓約束的電力市場(chǎng)有限理性古諾博弈的動(dòng)態(tài)演化研究[J].中國(guó)電機(jī)工程學(xué)報(bào),2005,12(23):71-79.

篇9

[關(guān)鍵詞]公職人員敗德行為監(jiān)管博弈

一、博弈論的引入

博弈論研究的是決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策均衡問(wèn)題,應(yīng)用最普遍的是納什均衡。而納什均衡,是指一組滿(mǎn)足給定對(duì)手的行為,各博弈方所做的是它所能做的最好的策略,為一種非合作博弈。博弈論的基本假設(shè)有兩個(gè):一是強(qiáng)調(diào)個(gè)體行為理性,假設(shè)當(dāng)事人在進(jìn)行“決策”時(shí),能夠充分考慮到他所面臨的局面,即他必須并且能夠充分考慮到人們之間行為的相互作用及其可能影響,并能夠做出合乎理性的選擇;二是假設(shè)博弈各方最大化自己的目標(biāo)函數(shù),能夠選擇使自身效益最大化的策略。博弈論分析的實(shí)質(zhì)是,在經(jīng)濟(jì)主體理性的條件下,行為主體根據(jù)給定的條件及對(duì)方的行為(策略)等,來(lái)決定自己的行為(策略),從而使自己的利益最大化。

公職人員敗德行為及其監(jiān)管的主體是公職人員及其監(jiān)管方,他們一般是行為理性的,顯然能清楚地認(rèn)識(shí)到擁有某種重要社會(huì)地位、薪金收入等的自身價(jià)值。但面臨紛繁復(fù)雜的外部環(huán)境誘惑,局中人還是會(huì)作出不同的決策,即選擇嚴(yán)監(jiān)管與否、選擇敗德行為與否取決于行為人對(duì)自身價(jià)值的認(rèn)識(shí)及與預(yù)期收益的比較,這幾點(diǎn)正好符合博弈論分析的基本特征,因此我們可以將博弈論引入公職人員敗德行為的研究中,來(lái)分析公職人員敗德行為及其監(jiān)管,并在此基礎(chǔ)上提出治理建議。

二、公職人員敗德行為及其監(jiān)管的博弈分析

(一)博弈模型的選擇

根據(jù)上述假設(shè)及分析建立公職人員敗德行為及其監(jiān)管的博弈模型。監(jiān)管方的純策略選擇是嚴(yán)監(jiān)管或松監(jiān)管(不監(jiān)管是松監(jiān)管的極限狀態(tài)),公職人員的純策略選擇是實(shí)施敗德行為或不實(shí)施敗德行為。表1概括了對(duì)應(yīng)不同純策略組合的支付矩陣。矩陣中第一個(gè)數(shù)字為監(jiān)管收益,第二個(gè)數(shù)字為公職人員收益。其中:Cs是監(jiān)管方實(shí)施松監(jiān)管的成本(不監(jiān)管時(shí)Cs=0),Cy為監(jiān)管方實(shí)行嚴(yán)監(jiān)管多支付的成本,Mg指公職人員實(shí)施敗德行為未被查出預(yù)期所得收益(包括政治利益、經(jīng)濟(jì)利益和其它不當(dāng)?shù)美龋?,Lj表示監(jiān)管人員工作失職可能受到的懲罰(包括刑事責(zé)任、行政處分、經(jīng)濟(jì)處罰等),Lg代表公職人員實(shí)施敗德行為被查出可能受到的懲罰(亦包括刑事責(zé)任、行政處分、經(jīng)濟(jì)處罰等)。

假設(shè)各利益相關(guān)者的策略如下:

Pj:監(jiān)管方嚴(yán)監(jiān)管的概率,則(1-Pj)為松監(jiān)管概率;

Pg:公職人員實(shí)施敗德行為的概率,則(1-Pg)為不實(shí)施敗德行為的概率。

矩陣中的四種策略組合表示的意義:當(dāng)監(jiān)管方嚴(yán)監(jiān)管時(shí)公職人員公然實(shí)施敗德行為,此時(shí)公職人員敗德行為被查出將蒙受Lg的損失,而工作出色的監(jiān)管人員將獲得獎(jiǎng)勵(lì)Mj,Mj扣除嚴(yán)監(jiān)管的成本(Cs+Cy)為監(jiān)管方的凈收益;當(dāng)監(jiān)管方嚴(yán)監(jiān)管時(shí),公職人員選擇遵紀(jì)守法不實(shí)施敗德行為,則監(jiān)管方損失嚴(yán)監(jiān)管的成本(Cs+Cy),而公職人員既無(wú)損失也無(wú)收益(收益為0);當(dāng)監(jiān)管方松監(jiān)管甚至不監(jiān)管時(shí),公職人員若選擇敗德行為,此時(shí)監(jiān)管方因監(jiān)管人員失職而受懲處導(dǎo)致?lián)p失(Cs+Lj),而公職人員則因敗德行為得逞獲得不當(dāng)?shù)美鸐g;當(dāng)監(jiān)管方松監(jiān)管時(shí),公職人員如沒(méi)有敗德行為,此時(shí)監(jiān)管方會(huì)損失松監(jiān)管成本Cs,而公職人員當(dāng)然既無(wú)損失也無(wú)收益(得益為0)。

表1:公職人員敗德行為及其監(jiān)管得益矩陣

得益矩陣

公職人員

實(shí)施敗德行為Pg

不實(shí)施敗德行為1-Pg

監(jiān)管方

嚴(yán)監(jiān)管

Pj

Mj-(Cs+Cy),-Lg

-(Cs+Cy),0

松監(jiān)管

1-Pj

-(Cs+Lj),Mg

-Cs,0

通過(guò)以上分析可知,如果監(jiān)管方實(shí)施松監(jiān)管,公職人員的最佳策略是實(shí)施敗德行為,以獲取額外非法得益;而當(dāng)公職人員實(shí)施敗德行為時(shí),監(jiān)管方的最佳策略是進(jìn)行嚴(yán)監(jiān)管,以打擊作奸犯科者,保障國(guó)家或企業(yè)不受損失。既然監(jiān)管方實(shí)施嚴(yán)監(jiān)管,公職人員的最佳策略是不實(shí)施敗德行為,以免受懲罰;而當(dāng)公職人員不實(shí)施敗德行為時(shí),監(jiān)管方的最佳策略是進(jìn)行松監(jiān)管甚至不監(jiān)管,使監(jiān)管成本最小化……如此重復(fù)的結(jié)果,不可能產(chǎn)生一個(gè)使博弈雙方愿意單獨(dú)改變自己策略的純策略組合,而只能以上面假設(shè)的某種概率,如Pg、Pj等隨機(jī)地選擇不同的策略組合構(gòu)成混合策略博弈的納計(jì)均衡。根據(jù)納什定理,在這種均衡條件下,監(jiān)管方和公職人員都無(wú)法通過(guò)改變自己的混合策略來(lái)改善自己的得益。

如果設(shè)監(jiān)管方和公職人員的期望收益分別為Ej和Eg,則:

Ej=Pj·{[Mj-(Cs+Cy)]·Pg+[-(Cs+Cy)](1-Pg)}

+(1-Pj)[-(Cs+Lj)·Pg+(-Cs)(1,-Pg)]

=MjPjPg+LjPjPg-CyPj-LjPg-Cs

Eg=Pg·[-Lg·Pj+Mg·(1-Pj)]+(1-Pg)[0·Pj+0·(1-Pj)]

=MgPg-LgPjPg-MgPjPg

若使公職人員敗德行為及其監(jiān)管的混合策略博弈達(dá)到納什均衡,

則:

MjPg+LjPg-Cy=0(1·1)

Mg-LgPj-MgPj=0(1·2)

解(1·1)、(1·2)組成的方程組,求得該混合策略的納什均衡解為:

=Mg/(Mg+Lg)和=Cy/(Mj+Lj)

(二)數(shù)據(jù)分析

在監(jiān)管人員查出敗德行為所得獎(jiǎng)勵(lì)Mj和因工作失職而受到的懲處Lj既定的情況下,即對(duì)監(jiān)管人員工作業(yè)績(jī)的獎(jiǎng)懲力度一定時(shí),公職人員實(shí)施敗德行為的最優(yōu)概率取決于監(jiān)管方實(shí)行嚴(yán)監(jiān)管多支付的成本Cy,且與其成正比。這預(yù)示著發(fā)現(xiàn)敗德行為需要支付很高的監(jiān)管成本,沒(méi)有付出高企的額外成本就不能發(fā)現(xiàn)敗德行為,意味著發(fā)現(xiàn)敗德行為的概率降低了,因而實(shí)施敗德行為變得相對(duì)的容易,故敗德行為的發(fā)生概率隨著監(jiān)管成本的增加反而提高了。反過(guò)來(lái)說(shuō),在一定條件下,設(shè)法降低嚴(yán)監(jiān)管多支付的成本就可以降低敗德行為的發(fā)生概率;同理,Cy一定時(shí)加大對(duì)監(jiān)管人員工作業(yè)績(jī)的獎(jiǎng)懲力度能達(dá)到同樣的監(jiān)管效果。但是,降低監(jiān)管方的監(jiān)管成本,加大對(duì)監(jiān)管人員工作業(yè)績(jī)的獎(jiǎng)懲力度,在短期內(nèi)可提高監(jiān)管人員實(shí)施嚴(yán)監(jiān)管的積極性,但長(zhǎng)期效果如何呢?

當(dāng)Pg>時(shí),監(jiān)管方的最佳策略是選擇嚴(yán)監(jiān)管。而根據(jù)=Cy/(Mj+Lj),公職人員選擇實(shí)施敗德行為的最優(yōu)概率只與Cy、Mj、Lj有關(guān),即與Cy成正比,與Mj、Lj兩者之和成反比。因而,降低Cy、提高M(jìn)j和Lj,都能降低發(fā)生敗德行為的最優(yōu)概率,從而達(dá)到Pg>,促使監(jiān)管人員履行職責(zé)。但長(zhǎng)此以往,在監(jiān)管方實(shí)施嚴(yán)監(jiān)管后,公職人員又會(huì)趨于選擇職務(wù)合法合規(guī)行為,而使敗德行為概率Pg降低,低至一定幅度就會(huì)導(dǎo)致監(jiān)管方嚴(yán)監(jiān)管與松監(jiān)管兩者的期望收益等值,監(jiān)管方又會(huì)重新選擇混合策略,出現(xiàn)重復(fù)博弈。而=Mg/(Mg+Lg)表明混合策略中監(jiān)管方選擇嚴(yán)監(jiān)管的概率主要與Mg、Lg有關(guān),而與監(jiān)管人員松監(jiān)管所受懲處Lj無(wú)關(guān)。因此,單純降低監(jiān)管方的監(jiān)管成本、加大對(duì)監(jiān)管人員的懲罰力度,而不改變公職人員期望得益,雖短期有作用,但長(zhǎng)期來(lái)看卻并未改變監(jiān)管人員的博弈策略選擇,對(duì)敗德行為效果不大。

同樣地,當(dāng)Pj>時(shí),公職人員最優(yōu)選擇是遵紀(jì)守法。故要使監(jiān)管有效,必須降低值。而由推導(dǎo)知,=Mg/(Mg+Lg)。在現(xiàn)實(shí)經(jīng)濟(jì)生活中,公職人員未被查出預(yù)期所得收益Mg是外生變量,雖然在不同的敗德行為行為中由案件的嚴(yán)重性決定可大可小,但在某一固定事件中通常為一常量,即可確定監(jiān)管者的最優(yōu)概率主要取決于敗德行為被查出受到的懲罰Lg,且成非嚴(yán)格意義上的反比關(guān)系。因而加大懲處力度,使Lg值變大,將降低監(jiān)管方的最優(yōu)概率,從而形成Pj>的局面,促使公職人員選擇不實(shí)施敗德行為。但久而久之,在沒(méi)有敗德行為的情況下,監(jiān)管方必然會(huì)理性地放松警惕,降低監(jiān)管力度至一定程度時(shí),敗德行為實(shí)施與否的期望收益相等,公職人員又會(huì)重新選擇混合策略,導(dǎo)致重復(fù)博弈。結(jié)果呢?根據(jù)=Cy/(Mj+Lj),與Lg無(wú)關(guān),即實(shí)施敗德行為的最優(yōu)概率與被查出的損失無(wú)關(guān)。此時(shí)即使被查出的損失Lg足夠大,根據(jù)博弈理論,如果監(jiān)管乏力,對(duì)公職人員而言也只是不可置信的威脅,必然繼續(xù)延續(xù)前科。因此,單純加強(qiáng)對(duì)公職人員敗德行為的懲處力度,加大其損失,而不改變監(jiān)管人員的期望得益,雖然短期內(nèi)使公職人員敗德行為有所收斂,但長(zhǎng)期也將導(dǎo)致監(jiān)管人員降低監(jiān)管力度,難以真正發(fā)揮控制敗德行為的作用。

三、啟示及建議

(一)公職人員是否實(shí)施敗德行為及監(jiān)管人員能否履行職責(zé)是問(wèn)題的兩個(gè)方面,單純采取對(duì)一方的獎(jiǎng)懲來(lái)誘導(dǎo)其行為也許短期有效,但從長(zhǎng)期看,并不能改善任何一方的理性和道德風(fēng)險(xiǎn)行為。為了達(dá)到(松監(jiān)管,不敗德行為)的目標(biāo),我們過(guò)去總是片面強(qiáng)調(diào)加大懲罰力度,因?yàn)樵谝欢ǚ秶鷥?nèi)懲罰得越嚴(yán)厲就越接近這一目標(biāo);與此同時(shí),也提倡配合一定的激勵(lì)措施,希望達(dá)到監(jiān)管方和公職人員的雙贏。但懲罰和激勵(lì)措施必須適度,而實(shí)際很難把握:對(duì)懲罰而言,力度過(guò)大會(huì)使部分公職人員產(chǎn)生逆反心理,形成拼死一搏的傾向,反而達(dá)不到約束的作用;對(duì)于激勵(lì)而言,其效果受多種因素影響,激勵(lì)程度不夠,會(huì)使監(jiān)管人員在收益增加的情況下仍然松于監(jiān)管,而過(guò)分激勵(lì)、收益過(guò)多會(huì)使監(jiān)管人員產(chǎn)生當(dāng)前的收益已經(jīng)足夠了的想法,喪失進(jìn)取動(dòng)力,同樣達(dá)不到目的。筆者認(rèn)為,由檢查力度、處罰力度和處罰執(zhí)行力度三者合一所決定的監(jiān)管環(huán)境是制約敗德行為的關(guān)鍵因素。治理敗德行為,應(yīng)由目前的加強(qiáng)對(duì)敗德行為公職人員的懲處力度為主,逐漸過(guò)渡到提高對(duì)違法者的檢查力度和處罰執(zhí)行力度與加強(qiáng)對(duì)敗德行為的懲處力度并重,加大對(duì)監(jiān)管人員失職行為的處罰力度與降低監(jiān)管成本并重,建立健全教育、制度、監(jiān)督并重。

(二)博弈論的研究表明,一個(gè)人作出的選擇,取決于其對(duì)該選擇成本收益的預(yù)期以及對(duì)他人選擇的預(yù)期。給定必需的權(quán)力和信息不完全這兩個(gè)條件,敗德行為及其監(jiān)管的內(nèi)在邏輯沿著成本和收益變動(dòng)的路徑展開(kāi)。因此,權(quán)力配置結(jié)構(gòu)問(wèn)題是監(jiān)管敗德行為機(jī)制設(shè)計(jì)及戰(zhàn)略選擇的根本問(wèn)題。亦即監(jiān)管敗德行為不能局限于在權(quán)力既定這一約束條件下只是通過(guò)加強(qiáng)對(duì)權(quán)力的外部制約來(lái)監(jiān)督控制公職人員敗德行為而不改變現(xiàn)有的權(quán)力結(jié)構(gòu)。如擴(kuò)大公眾的監(jiān)督權(quán),把某些不必要集中的權(quán)力下放到市場(chǎng)中,是監(jiān)管敗德行為的釜底抽薪之計(jì)。其次,改善權(quán)力配置的信息結(jié)構(gòu)、提高透明度,包括完善政務(wù)公開(kāi)、重大問(wèn)題決策公開(kāi)、選拔干部公開(kāi)等制度,細(xì)化公職人員職務(wù)權(quán)力義務(wù)的規(guī)定等是監(jiān)管敗德行為的另一項(xiàng)重要措施。另外,給定監(jiān)管敗德行為的必要條件(如制度、信息不完備),監(jiān)管人員與公職人員的期望得益、價(jià)值取向和道德約束主宰著實(shí)施敗德行為的動(dòng)機(jī),從另一側(cè)面說(shuō)明了建立健全教育、制度、監(jiān)督并重的懲治和預(yù)防腐敗體系的特殊意義。

(三)博弈過(guò)程是一個(gè)長(zhǎng)期復(fù)雜的過(guò)程。松監(jiān)管,不敗德行為作為我們追求的最終目標(biāo),是均衡點(diǎn)而不是一次博弈的結(jié)果。它是博弈雙方經(jīng)過(guò)長(zhǎng)期磨合和斗爭(zhēng)、反復(fù)修訂各自的策略、經(jīng)過(guò)多次博弈最終形成的結(jié)論。隨著內(nèi)外部環(huán)境的變化,隔一段時(shí)間各方還要進(jìn)行修訂,以逐步接近最佳點(diǎn)。而且,達(dá)到最佳點(diǎn)涉及到政府政策、社會(huì)風(fēng)尚、道德水準(zhǔn)等許多方面,并不是只論及本文中提到的兩方,也就是說(shuō),這在實(shí)際中應(yīng)該是一個(gè)多方博弈,甚至牽涉監(jiān)管人員和公職人員的合謀問(wèn)題,達(dá)到均衡點(diǎn)不是一朝一夕的事,由于本人水平的限制,很多問(wèn)題由待大家共同研究。

[參考文獻(xiàn)]

[1].張維迎.博弈論與信息經(jīng)濟(jì)學(xué)[M].上海:上海人民出版社,1996.

篇10

張1.6

假定消費(fèi)者從價(jià)格低的廠(chǎng)商購(gòu)買(mǎi)產(chǎn)品,如果兩企業(yè)價(jià)格相同,就平分市場(chǎng),如果企業(yè)i的價(jià)格高于另一企業(yè),則企業(yè)i的需求量為0,反之,其它企業(yè)的需求量為0。因此,企業(yè)i的需求函數(shù)由下式給出:

從上述需求函數(shù)的可以看出,企業(yè)i絕不會(huì)將其價(jià)格定得高于其它企業(yè);由于對(duì)稱(chēng)性,其它企業(yè)也不會(huì)將價(jià)格定的高于企業(yè)i,因此,博弈的均衡結(jié)果只可能是每家企業(yè)的價(jià)格都相同,即pi=pj。但是如果pi=pj>c那么每家企業(yè)的利潤(rùn),因此,企業(yè)i只要將其價(jià)格略微低于其它企業(yè)就將獲得整個(gè)市場(chǎng)的需求,而且利潤(rùn)也會(huì)上升至,。同樣,其它企業(yè)也會(huì)采取相同的策略,如果此下去,直到每家廠(chǎng)商都不會(huì)選擇降價(jià)策略,此時(shí)的均衡結(jié)果只可能是pi=pj=c。此時(shí),企業(yè)i的需求函數(shù)為。

張1.8

張2.3

張2.4

張2.9

(1)由于古諾博弈的階段均衡是,此時(shí)的利潤(rùn)為;若各家企業(yè)合作壟斷市場(chǎng),則此時(shí)的最優(yōu)產(chǎn)量是,可求得,此時(shí)的利潤(rùn)為,此時(shí)若有企業(yè)i背叛,其產(chǎn)量就是,其收益為。下面我們來(lái)看重復(fù)博弈下的古諾博弈。在這個(gè)博弈中,有兩個(gè)博弈路徑,我們分別進(jìn)行討論。

首先,在懲罰路徑上,由于每個(gè)階段參與企業(yè)選擇的都是最優(yōu)的產(chǎn)量,因此能夠獲得最優(yōu)的收益,因此是均衡的。

其次,在合作路徑上,只要合作的收益大于背叛的收益,則均衡也是可以實(shí)現(xiàn)的,這要求:,解得。

(2)伯川德博弈的階段均衡是,此時(shí)參與者的利潤(rùn)均為0。若各企業(yè)合作,則此時(shí)的最優(yōu)價(jià)格是:,此時(shí),則,利潤(rùn)為。而若有企業(yè)i背叛,則其選擇價(jià)格,其產(chǎn)量為Q,利潤(rùn)為。下面我們來(lái)看重復(fù)博弈下的伯川德博弈,在這個(gè)博弈中,也有兩個(gè)博弈路徑,我們分別討論如下:

首先在懲罰路徑上,由于每個(gè)階段的企業(yè)選擇都是眼前最優(yōu),因此,它能夠?qū)崿F(xiàn)均衡。

其次,在合作路徑上,只要合作的收益大于背叛的收益,則均衡也是可以實(shí)現(xiàn)的,這就要求:,求得。

(3)伯川德博弈中的最低貼現(xiàn)因子小于古諾博弈中的貼現(xiàn)因子的原因在于其懲罰要嚴(yán)重的多,因此其對(duì)于耐心的要求也就要相對(duì)較小。

張3.4

類(lèi)似的題:

張3.8

張4.2