erik estrada
核心速遞
SciLens :利用社交媒體和科學文獻指標評估科技新聞文章的質量;
社會網絡的迭代局部模型;
從路徑聚合中學習圖中的邊屬性;
基于子集選擇的方法尋找復雜網絡的重要結構;
從 Twitter 語料庫中提取本地化信息用于洪澇預防;
資本成本的區(qū)域差異對具有雄心勃勃的二氧化碳減排目標的電力系統(tǒng)優(yōu)化設計的影響;
意見形成的統(tǒng)計物理學:它是否屬于該領域?;
什么使驗證用戶與眾不同? Twitter 上驗證用戶的認識、分析和預測;
QuickStop :最快錯誤信息檢測的馬爾科夫最優(yōu)停止方法;
勞動力流動網絡的摩擦失業(yè);
間作農業(yè)可持續(xù)蚜蟲防治的數學模型;
用社交媒體表征當地對移民的態(tài)度;
智能高速公路流密度關系變異性的實證分析;
“堅持在那里”:使用詞匯和視覺分析識別具有移情反應的帖子;
學習圖聚類的分辨率參數;
原文標題:
SciLens: Evaluating the Quality of Scientific News Articles Using Social Media and Scientific Literature Indicators
地址:
http://arxiv.org/abs/1903.05538
作者:
Panayiotis Smeros, Carlos Castillo, Karl Aberer
摘要:本文描述,開發(fā)和驗證了 SciLens,一種評估科學新聞文章質量的方法。我們工作的出發(fā)點是結構化方法,定義了一系列用于手動評估新聞的質量方面?;谶@些方面,我們描述了一系列新聞質量指標。根據我們的實驗,與無法獲得這些指標的非專家相比,這些指標有助于非專家更準確地評估科學新聞文章的質量。
此外,SciLens 還可用于為文章生成完全自動化的質量得分,與非專家進行的人工評估相比,專家評估員更愿意。 SciLens 的主要元素之一是關注文章的內容和背景,其中上下文由(1)文章對科學文獻的明確和隱含參考,以及(2)社交媒體中引用文章的反應提供。我們表明,兩個上下文元素都可以成為確定文章質量的重要信息來源。 SciLens 的驗證通過專家和非專家注釋的組合完成,證明了其對科學新聞的半自動和自動質量評估的有效性。
社會網絡的迭代局部模型原文標題:
The Iterated Local Model for Social Networks
地址:
http://arxiv.org/abs/1903.04523
作者:
Anthony Bonato, Huda Chuangpishit, Sean English, Bill Kay, Erin Meger
摘要:諸如在 Facebook 和 Twitter 中的在線社會網絡通常從網絡中的代理之間的友誼關系的角度進行研究。然而,對抗關系在社會網絡的結構和功能中也發(fā)揮著重要作用,但往往是隱藏的。結構平衡理論預測了社會網絡的潛在生成機制,結構平衡理論假設三位代理人更喜歡傳遞,朋友的朋友更可能是朋友,或反傳遞,對手的對手成為朋友。先前提出的迭代局部傳遞(ILT)和迭代局部反傳遞(ILAT)模型分別將傳遞性和反傳遞性作為演化機制。
這些模型產生了具有社會網絡的許多可觀察屬性的圖,例如低直徑,高聚類和致密化。我們提出了一種新的生成模型,稱為迭代局部模型(ILM),用于隨時間推移合成傳遞和反傳遞三元組的社會網絡。在 ILM 中,我們給出了一個可數無限的二進制序列作為輸入,該序列決定了我們是應用傳遞步還是反傳遞步。得到的模型顯示出在 ILT 和 ILAT 模型中觀察到的復雜網絡的許多特性。
特別地,對于任何輸入二進制序列,我們表明漸近模型生成有限圖,其密集化,聚類系數遠離0,直徑最多為3,并且表現出不良的譜擴展。我們還對 ILM 圖的誘導子圖的色數,控制數,哈密爾頓性和同構類型進行了全面的分析。
從路徑聚合中學習圖中的邊屬性原文標題:
Learning Edge Properties in Graphs from Path Aggregations
地址:
http://arxiv.org/abs/1903.04613
作者:
Rakshit Agrawal, Luca de Alfaro
摘要:圖邊及其標簽可以表示基本重要性的信息,例如網頁之間的鏈接,用戶之間的友誼,用戶給予其他用戶或項目的評級等等。我們介紹了 LEAP,一種可訓練的通用框架,用于根據圖的局部結構,拓撲和標簽預測邊的存在和屬性。 LEAP 框架基于連接圖中節(jié)點的路徑的探索和機器學習聚合。
我們提供了幾種通過訓練路徑聚合器來執(zhí)行聚合階段的方法,并且我們通過將其應用于社會網絡中的鏈接和用戶評級的預測來證明框架的靈活性和通用性。我們在兩個問題上驗證 LEAP 框架:鏈路預測和用戶評級預測。在八個大型數據集中,其中包括 arXiv 協(xié)作網絡,酵母蛋白質 - 蛋白質相互作用以及美國航空公司路由網絡,我們表明 LEAP 的鏈路預測性能至少與當前最先進的方法一樣好,例如作為海豹突擊隊和 WLNM。
接下來,我們考慮預測其他用戶的用戶評級的問題:這個問題被稱為加權符號網絡(WSN)中的邊權重預測問題。在比特幣網絡和維基百科 RfA 上,我們表明 LEAP 的表現始終優(yōu)于基于公平與良好的回歸模型,將訓練邊的數量在10%到90%之間變化。這些例子表明,LEAP 雖然具有通用性,但可以與特別精心設計的方法的性能相匹配或最佳,以解決非常具體的邊預測問題。
基于子集選擇的方法尋找復雜網絡的重要結構原文標題:
A subset selection based approach to finding important structure of complex networks
地址:
http://arxiv.org/abs/1903.04649
作者:
Richa Tripathi, Amit Reza
摘要:大多數現實世界的網絡,如互聯(lián)網,協(xié)作網絡,大腦網絡,引用網絡,電力線和航空網絡都非常龐大,要研究它們的結構和動態(tài),通常需要使用大型連接(鄰接)矩陣。然而,幾乎總是如此,一些或有時大多數節(jié)點及其連接對于網絡功能不是非常關鍵,或者網絡對于某些節(jié)點的故障及其與網絡其余部分的連接是健壯的。在目前的工作中,我們的目標是提取復雜網絡的尺寸減小表示,使得新表示具有最相關的網絡節(jié)點和連接并保持其譜特性。
為此,我們使用子集選擇(SS)過程。通常,SS 方法用于從其最具信息性的列中檢索矩陣中的最大信息。檢索的矩陣(通常稱為子集)具有具有最小線性相關性的原始矩陣的列。我們將 SS 過程的應用呈現給現實世界網絡的許多鄰接矩陣和模型網絡類型以提取它們的子集。由于其小尺寸的子集可以在分析大型復雜網絡的譜特性中起關鍵作用,其中分析全鄰接矩陣的空間和時間復雜度太昂貴。從所獲得的子集構造的鄰接矩陣具有較小的尺寸并且代表最重要的網絡結構。我們觀察到幾乎是原始網絡一半大小的子網絡具有比原始網絡更好的信息流效率。
從 Twitter 語料庫中提取本地化信息用于洪澇預防原文標題:
Extracting localized information from a Twitter corpus for flood prevention
地址:
http://arxiv.org/abs/1903.04748
作者:
Etienne Brangbour, Pierrick Bruneau, Stéphane Marchand-Maillet, Renaud Hostache, Patrick Matgen, Marco Chini, Thomas Tamisier
摘要:在本文中,我們討論了與熱帶風暴哈維相關的語料庫的集合,以及從空間和主題角度的分析。從空間角度來看,我們的目標是首先估計收集的語料庫中的地理信息的粒度和可靠性。從主題角度來看,我們討論了 Twitter 帖子的表示,以及處理最初未標記的推文語料庫的策略。
資本成本的區(qū)域差異對具有雄心勃勃的二氧化碳減排目標的電力系統(tǒng)優(yōu)化設計的影響原文標題:
Implications of regional differences in costs for capital on the optimal design of power systems with ambitious CO2 reduction targets
地址:
http://arxiv.org/abs/1903.04768
作者:
Bruno U. Schyska, Alexander Kies
摘要: 為了減少電力部門的溫室氣體排放,需要將高比例的可再生能源集成到現有系統(tǒng)中。這將需要大量投資。已經表明,這些投資所需的資本成本在歐洲地區(qū)之間分布不均。它們顯示出明顯的南北和西 - 東分歧,近年來沒有顯示出明顯縮小的跡象。
然而,調查歐洲大陸電力系統(tǒng)的電力系統(tǒng)研究通常假設資本成本均勻。本文的目的是研究資本成本的區(qū)域差異如何影響這些研究在最優(yōu)電力系統(tǒng)設計方面的結果。我們的分析基于電力系統(tǒng)優(yōu)化,歐洲資本成本不均勻。我們發(fā)現,假設資本的同質成本導致對發(fā)電能力的非最佳投資。整個歐洲的電力支出不平等減少,而整個系統(tǒng)成本的變化很小。此外,發(fā)現資本的不均勻成本有利于整體風力發(fā)電部署,而太陽能則受到影響。
意見形成的統(tǒng)計物理學:它是否屬于該領域?原文標題:
Statistical Physics Of Opinion Formation: is it a SPOOF?
地址:
http://arxiv.org/abs/1903.04786
作者:
Arkadiusz J?drzejewski, Katarzyna Sznajd-Weron
摘要:我們基于非線性 q -voter 模型提出了關于在意見形成統(tǒng)計物理學(SPOOF)中提出的問題和方法的簡短回顧。我們描述了由物理學家開發(fā)的意見形成模型與社會心理學中已知的社會反應理論模型之間的關系。我們提請注意社會心理學家和物理學家感興趣的問題。
我們展示了直接受社會心理學啟發(fā)的研究實例,如:“獨立與反社會”或“人格與情境”。我們總結了已經獲得的結果,并指出了其他可以做的事情,也與 SPOOF 中的其他模型有關。最后,我們展示了幾種在 SPOOF 中有用的分析方法,例如有效力和潛力的概念, Landau 的相變方法,或平均場和對近似。
什么使驗證用戶與眾不同? Twitter上驗證用戶的認識、分析和預測原文標題:
What sets Verified Users apart? Insights, Analysis and Prediction of Verified Users on Twitter
地址:
http://arxiv.org/abs/1903.04879
作者:
Indraneil Paul, Abhinav Khattar, Shaan Chopra, Ponnurangam Kumaraguru, Manish Gupta
摘要:社會網絡和發(fā)布平臺,例如 Twitter ,支持秘密專有驗證過程的概念,用于他們認為值得在平臺范圍內公共利益的句柄。與先前的重要工作一致,這表明擁有這樣的地位象征著平臺觀眾眼中的可信度提升,在公眾人物和品牌中明顯令人垂涎。不太明顯的是驗證過程的內部運作和被驗證的內容。
這種缺乏透明度,加上 Twitter 在2017年通過將上述地位擴展到政治極端主義者而獲得的抨擊,支持 Twitter 公開承認這一過程以及所代表的地位需要重新思考。考慮到這一點,我們試圖解開用戶個人資料的各個方面,這些方面可能會導致或排除驗證。本文的目的有兩個方面:首先,我們測試是否可以從配置文件元數據和內容功能中辨別句柄的驗證狀態(tài)。
其次,我們解開了對手柄驗證狀態(tài)影響最大的特征。我們收集了一個數據集,其中包含所有231,235名經過驗證的英語用戶的個人資料元數據(截至2018年7月),一個對照樣本,包括175,930名未經過驗證的英語用戶以及一年收集期間的4.94億條推文。我們提出的模型能夠可靠地識別驗證狀態(tài)(曲線下面積 AUC> 99%)。我們表明公共列表成員數量,推文中的中性情緒和權威語言風格是驗證狀態(tài)最相關的預測因子。據我們所知,這項工作代表了首次嘗試在 Twitter 上識別和分類有價值的驗證用戶。
QuickStop:最快錯誤信息檢測的馬爾科夫最優(yōu)停止方法原文標題:
QuickStop: A Markov Optimal Stopping Approach for Quickest Misinformation Detection
地址:
http://arxiv.org/abs/1903.04887
作者:
Honghao Wei, Xiaohan Kang, Weina Wang, Lei Ying
摘要:本文結合數據驅動和模型驅動的方法進行實時錯誤信息檢測。我們的算法名為 QuickStop,是一種基于從標記數據獲得的概率信息傳播模型的最優(yōu)停止算法。該算法包括用于學習概率信息傳播模型的離線機器學習算法和用于檢測錯誤信息的在線最優(yōu)停止算法。在線檢測算法具有低計算和存儲器復雜性。我們使用實際數據集進行的數值評估表明,QuickStop 在準確度和檢測時間(檢測所需的觀察數量)方面優(yōu)于現有的錯誤信息檢測算法。我們對合成數據的評估進一步表明, QuickStop 對(離線)學習錯誤很有用。
勞動力流動網絡的摩擦失業(yè)原文標題:
Frictional Unemployment on Labor Flow Networks
地址:
http://arxiv.org/abs/1903.04954
作者:
Robert L. Axtell, Omar A. Guerrero, Eduardo López
摘要:我們?yōu)榭傮w匹配函數開發(fā)了另一種理論,即工人通過企業(yè)網絡尋找工作:勞動力流動網絡。兩家公司之間缺乏優(yōu)勢表明,由于高度摩擦,他們之間無法實現勞動力流動。在均衡狀態(tài)下,企業(yè)的招聘行為通過網絡相關聯(lián),產生高度分解的當地失業(yè)。
因此,聚合以非平凡的方式取決于網絡的拓撲。該理論為貝弗里奇曲線,工資分散和雇主規(guī)模溢價提供了新的微觀基礎。我們將我們的模型應用于雇主 - 雇員匹配的記錄,并發(fā)現具有帕累托分布式連接的網絡拓撲導致在高勞動力供給彈性下的總失業(yè)率發(fā)生不成比例的大變化。
間作農業(yè)可持續(xù)蚜蟲防治的數學模型原文標題:
Mathematical modeling for sustainable aphid control in agriculture via intercropping
地址:
http://arxiv.org/abs/1903.05043
作者:
Alfonso Allen-Perkins, Ernesto Estrada
摘要:農業(yè)對有害生物的損失是全球變暖情景中的一項重要挑戰(zhàn)。間作是一種替代農業(yè)實踐,可在不使用化學殺蟲劑的情況下促進害蟲防治。在這里,我們開發(fā)了一個數學模型來研究間作農業(yè)領域的流行病傳播和控制,作為農業(yè)可持續(xù)的病蟲害管理工具。
該模型結合了農業(yè)領域中傳播病毒的蚜蟲的運動,間作田間植物的空間分布,以及流行病學易感染 - 去除(SIR)模型中“陷阱作物”的存在。使用該模型,我們研究了沒有和與陷阱作物相關的幾種間作安排,并找到了一種新的間作安排,相對于常用的間作系統(tǒng),它可以顯著改善農業(yè)領域的病蟲害管理。
用社交媒體表征當地對移民的態(tài)度原文標題:
Characterization of Local Attitudes Toward Immigration Using Social Media
地址:
http://arxiv.org/abs/1903.05072
作者:
Yerka Freire, Eduardo Graells-Garrido
摘要:遷移是一種全球性現象,可能在人群中產生不同的反應。態(tài)度不同于那些支持當地人和外國人之間的多元文化和交流,以及對移民的蔑視和仇恨。由于反移民態(tài)度往往在暴力和歧視行為中得到體現,因此必須確定表征這些態(tài)度的因素。然而,這樣做是昂貴且不切實際的,因為傳統(tǒng)方法需要付出巨大努力來收集數據。
在本文中,我們建議利用 Twitter 來描述當地對移民的態(tài)度,并對智利進行了案例研究,近年來移民人口急劇增加。使用半監(jiān)督主題建模,我們將 49K 用戶定位在從有利于移民到反對移民的范圍內。我們從兩個方面對譜的兩個方面進行了表征:與每種態(tài)度相關的情感和詞匯類別,以及討論網絡結構。我們發(fā)現討論主要是海地移民;討論的趨勢和極性存在時間趨勢;并且網絡上的分類行為在態(tài)度上有所不同。這些見解可以為政策制定者提供有關移民方面的感受的信息,對政策溝通和改善群體間關系的干預措施的設計具有潛在影響。
智能高速公路流密度關系變異性的實證分析原文標題:
Empirical analysis of the variability in the flow-density relationship for smart motorways
地址:
http://arxiv.org/abs/1903.05112
作者:
Kieran Kalair, Colm Connaughton
摘要:基本圖是交通流量和交通密度之間假定的函數關系。在實踐中,這種關系是嘈雜的并且表現出顯著的統(tǒng)計變異性。在智能高速公路上,這種可變性通過基本圖未捕獲的可變速度限制而增加。為了研究這種可變性,考慮密度和流量的聯(lián)合概率分布函數( pdf )是合適的。我們使用來自倫敦 M25 的64個部分的74天數據,對流量和密度之間關系的變化進行了實證研究。
目標是確定流量密度關系中的多少變化是由變速限制產生的,并評估基本圖的特定功能形式是否系統(tǒng)偏好。根據經驗,流量和密度的聯(lián)合 pdf 是雙峰的,說明交通流量通常在高密度或低密度體系中發(fā)現,但很少在兩者之間。我們發(fā)現高密度區(qū)域受到變速限制的強烈影響,而低密度區(qū)域則不然。基本圖的 Daganzo-Newell (三角形)模型系統(tǒng)地最適合數據。
但是,最佳參數隨位置而變化。這些參數的聚類分析表明三種不同類型的流密度關系適用于 M25 的不同部分。這些聚類在流動破壞的頻率和嚴重性方面具有自然的解釋。事故率還取決于集群類型,表明可能鏈接到流量密度關系之外的交通流量的其他屬性。
“堅持在那里”:使用詞匯和視覺分析識別具有移情反應的帖子原文標題:
“Hang in There”: Lexical and Visual Analysis to Identify Posts Warranting Empathetic Responses
地址:
http://arxiv.org/abs/1903.05210
作者:
Mimansa Jaiswal, Sairam Tabibu, Erik Cambria
摘要:在過去幾年中,社交媒體已經成為一個平臺,人們在這個平臺上表達和分享關于虐待,暴力和心理健康問題的個人事件。需要查明這些帖子并了解預期的響應類型。為此,我們理解個人故事在不同社交媒體網站上發(fā)布的關于濫用或心理健康主題的不同帖子的情緒。在本文中,我們提出了一種由手工制作的功能支持的方法,以判斷該帖子是否需要移情反應。該模型在各種網頁和相應評論的帖子上進行訓練,包括字幕和圖像。我們能夠在標記需要移情反應的帖子中獲得80%的準確率。
學習圖聚類的分辨率參數
原文標題:
Learning Resolution Parameters for Graph Clustering
地址:
http://arxiv.org/abs/1903.05246
作者:
Nate Veldt, David F. Gleich, Anthony Wirth
摘要:在圖中找到連接良好的節(jié)點的集群是基于圖的數據分析中廣泛研究的問題。由于其應用眾多,已經提出并分析了大量不同的圖聚類目標函數和算法。為了幫助從業(yè)者確定在不同應用中使用的最佳聚類方法,我們提出了自動學習如何設置聚類分辨率參數的新技術。這些參數控制通過優(yōu)化廣義目標函數形成的社區(qū)的大小和結構。
我們首先形式化參數適應度函數的概念,該函數測量固定輸入聚類近似如何很好地解決特定分辨率參數值的廣義聚類目標。在適合兩個關鍵圖聚類應用的合理假設下,可以使用類似二分的方法有效地最小化這樣的參數適應度函數,從而產生與示例聚類很好地匹配的分辨率參數。我們將框架視為一種單次超參數調整,因為我們只需一個例子即可學習一個好的分辨率參數。
我們的一般方法可用于學習局部和全局圖聚類目標的分辨率參數。我們在實際數據的幾個實驗中展示了它的實用性,其中有助于從給定的示例聚類中學習分辨率參數。
來源:網絡科學研究速遞
編輯:孟婕
聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在微信公眾號“網絡科學研究速遞”(微信號netsci)和個人博客 https://www.complexly.me (提供RSS訂閱)進行同步更新。
近期網絡科學論文速遞
在線分工:開源軟件中的涌現結構 等18篇
增長圖的生成圖卷積網絡等15篇
分析多層網絡中的模體等5篇
多層網絡可視化的現狀 等12篇
維基百科數學家網絡分析 等14篇
加入集智,一起復雜!
集智俱樂部QQ群|877391004
商務合作及投稿轉載|swarma@swarma.org
◆ ◆ ◆搜索公眾號:集智俱樂部
加入“沒有圍墻的研究所”
讓蘋果砸得更猛烈些吧!