在线观看黄色大片-在线观看黄色x视频-在线观看黄日本高清视频-在线观看黄免费-高清潢色大片-高清黄色直接看

大眾可視化:精美酷炫的可視化圖表,自動生成!

原文鏈接:https://mp.weixin.qq.com/s/_Sw794CN0VcZq6SSEorN1A

編者按:作為一種信息載體,數據可視化可以將枯燥的文字轉變成高顏值且直觀的圖表,實現“一圖勝千言”。但要想制作“好的可視化”內容需要極其專業的數據分析能力和圖表設計能力,對普通人來說門檻較高。本文中,微軟亞洲研究院數據、知識、智能組研究員為大家介紹他們在大眾可視化領域的一些探索,讓可視化融入普通人的生活中。

在過去十幾年的發展中,數據可視化作為一個新興學科,在信息表達能力方面已經得到了廣泛認可,完成了從零到一的轉變。但由于相對較高的制作門檻,可視化內容的制作仍然只能由少數專業人士完成,限制了數據可視化的發展。要想實現從一到一萬的蛻變,數據可視化必然要走向大眾化。

雖然可視化內容的制作過程比較復雜,但是理解的門檻相對較低。研究表明,超過90%的信息是以視覺元素的方式進入人腦的,所以無需專業訓練,普通人天生就有從圖形圖像中尋找信息和發現規律的能力。另外,相比于枯燥的文字,人們往往更容易被精致的圖形設計所吸引,也有更強的興趣去理解和閱讀可視化內容。這些都讓可視化技術有一個龐大的潛在用戶群體,也預示了可視化內容作為一種大眾消費內容的巨大潛力。

有數據表明,2010年以來,網絡上的可視化內容的數量增長了一百多倍,而2019年更是有有超過八成的博客帖子至少帶有一個可視化圖表。由此可見,可視化的大眾化不僅僅是我們的愿景,而已經是一個正在慢慢發生的趨勢了。

什么是可視化,為什么要可視化?

提到數據可視化,大家首先想到的可能會是餅圖、柱狀圖之類的傳統圖表。不可否認,這些是,而且一直會是數據可視化的重要手段。但是,隨著新的數據類型不斷出現,以及在計算機技術的加持之下,新的數據可視化技術也在不斷的涌現(如圖1 所示)。但萬變不離其宗,可視化的本質也一直沒有發生改變:將抽象的數據或信息用直觀的視覺元素展示出來,以幫助人們快速地理解內容、發現規律、交流信息。一個好的可視化內容能夠高度概括紛繁復雜的數據,同時將隱藏的規律變得清晰明了。在這個大數據已經成為基本生產資料的時代,可視化愈發體現出了它不可替代的價值。


圖1:推特主題演化的可視化

對于數據分析師而言,可視化技術能幫他們理解每天都在源源不斷生成的大量的新數據。雖然機器學習方法能夠從茫茫原始數據中提煉出關鍵信息,但是這些信息只有在經過人們的理解并產生最后的決策的時候才能真正體現它們的價值,而可視化恰恰能幫人們完成這最后的臨門一腳。首先,它能將枯燥復雜的數據變得清晰友好,幫助人們快速全面地掌握關鍵信息;其次,可視化系統往往支持實時處理和交互分析,這都能夠幫助決策者跟蹤變化和理解變化背后的原因。統計數據表明,在可視化技術的幫助下,人們有28%的概率能夠更及時地做出判斷和決策。

另一方面,普通人對可視化的需求也是巨大的。在這個大數據時代,人人可以很方便地在互聯網上找到各種信息。但快節奏的生活也導致人們不愿意花太多時間去去理解各種信息。有研究表明,人們平均只會花37秒在一篇網絡文章上。那么如何能在37秒內把想表達的信息順利準確的傳遞給讀者呢?答案就是可視化。作為一個高效的信息載體,可視化恰好滿足了人們這種快餐信息的需求。

大眾可視化的挑戰

雖然可視化有上面所說的諸多優點,但并不是說所有的可視化內容都能提供這種好處。假如我們只是簡單地把數據一股腦的堆在畫布上,這種所謂的可視化很可能適得其反,反而增加了人們閱讀的難度。所以,我們在上文中的描述都有一個前提,那就是“好的可視化”,即需要在設計和數據中找到一個平衡點。

首先,一個好的可視化應該能夠高效地表達出它想傳達的消息,它既不能復雜到失去焦點,也不能簡單到丟失信息;其次,一個好的可視化應該符合人的習慣,能自我解釋。換言之,人們不用借助說明書就能夠毫無障礙地閱讀;再次,一個好的可視化應該美觀,優美的設計能夠極大地增強對讀者的吸引力。如果把可視化比作是一種數據到設計的翻譯,那么我們可以認為這些是可視化在“信達雅”上的要求。

對于普通人而言,想要制作一個符合上述要求的可視化內容絕對不是一件容易的事情。從獲取信息到制作可視化內容,主要面臨三大挑戰:首先是信息獲取的障礙,如何操作復雜的數據分析軟件從數據中抽取重要的信息?其次是設計挑戰,什么樣的設計能既美觀又高效地表達我們想要傳達的信息?最后是制作挑戰,如何通過各種工具制作最終的可視化內容?要想讓所有人都能夠隨時隨地地便捷使用可視化內容,實現大眾可視化,這三大障礙都必須被克服。

我們在大眾可視化上的嘗試

大眾可視化的關鍵在于要讓所有人都能毫無障礙地制作好的可視化。但是,人們使用信息可視化的場景千差萬別,而不同的場景中人們碰到的障礙也不盡相同。在這里,我們選取了兩個常見場景進行了一些初步探索。

Text-to-Viz

假設這樣一個場景:某人正在準備一篇文章或是演講幻燈片。在這個過程中,他覺得有一個觀點應該被重點強調。這時加入一個信息圖會是一個很好的選擇。現在,他需要先上網去尋找一些信息圖的設計靈感,然后使用合適的工具將這個設計做出來。這一過程會耗費不少時間和精力,很多可視化的潛在用戶可能會因此放棄這一選項。

針對這個場景,我們設定了一個目標,那就是將這個制作過程完全自動化。這個可視化的制作過程就如同一條全自動流水線,輸出的產品是可視化內容,而輸入的原材料我們選擇了對用戶要求最低的自然語言。

當然,由于信息的總類五花八門,所以在這次探索里,我們選定了在信息圖表中最常見的一類關于比例的信息。例如,用戶的輸入是“3 out of 5 Chinese people live in rural areas“(每五個中國人中就有三個住在農村地區)這句話,那我們就會自動的設計出合適的信息圖(如圖2所示)。


圖2:信息圖

從用戶的輸入到信息圖的輸出,這顯然不是一件簡單的任務,中間涉及到了許多的技術難點。為此,我們設計了一套復雜的流程。首先通過自然語言分析從文本中提取關鍵的信息,諸如整體是什么、部分是什么、比例是多少等等;然后,我們收集了網絡上大量的設計案例,在這些案例的基礎上我們總結并設計出了一套自動設計的算法,將信息分別轉化成圖形、布局、顏色等等,最終合成許多可能的信息圖;最后我們對信息圖在若干個維度上評估打分,輸出系統推薦出來的最好結果。

詳細內容請參考論文Text-to-Viz: Automatic Generation of Infographics from Proportion-Related Natural Language Statements (IEEE VIS 2019)。

論文鏈接:https://arxiv.org/abs/1907.09091

DataShot

如今我們經常在網絡上看到類似于“有關互聯網的十個事實“的各種各樣的數據海報。這些海報用各種視覺元素簡明描繪了各種信息,以達到教育、宣傳的目的。但是這種海報的制作也是一個極其復雜的工程。并不是所有人都像數據分析師一樣,能夠用各種復雜的工具對數據行分析,提煉故事,然后將其清晰簡要的展示出來。所以我們也嘗試去自動化這個過程。

在這個場景中,我們假想人們只有數據但并不知道數據內部的故事,而我們目標是從一個原始表格數據中自動挖掘信息,整理信息,最后自動生成一個生動的描述數據內故事的一個圖形海報(如圖3所示)。


圖3:數據海報

與上一個場景相同,為了讓這個過程全自動,我們也設計了若干新的技術。首先我們分析了數據海報的組成成分,對數據中可能產生的故事建了一個模型。當給定一個數據集的時候,我們嘗試從數據中收集各種類型的事實或是規律。然后將挖掘出的事實整理成有條理的故事。最后,我們實現了一套基于決策樹的設計的系統,將整理出的故事可視化,然后自動布局到海報上。

詳細內容請參考論文DataShot: Automatic Generation of Fact Sheets from Tabular Data (IEEE VIS 2019)。

論文鏈接:http://aka.ms/AA6xrgi

當然,人們在現實生活中會遇到更多樣和更復雜的場景,我們在上述兩個場景中做了一些初步的嘗試無法覆蓋到所有的數據類型或情況。但我們相信,可視化的未來在于普通人的使用場景中。如今顯示設備和計算設備已經在人們的生活中廣泛普及,如果可視化制作的障礙也能夠被移除,那么,憑借它強大表達能力,可視化一定會惠及每一個普通人,成為我們日常使用的一大工具。

主站蜘蛛池模板: 97久久精品午夜一区二区| 国产亚洲欧美一区二区三区| 日韩在线一| 免费黄在线看| 亚洲日本一区二区三区在线不卡| 动漫网站免费在线观看| 久久国产免费观看精品1| 天天操夜操| 免费看黄色的网站| 九九热国产精品视频| 亚洲精品小视频| 国产精品久久久香蕉| 久热这里只有精品99国产6| 我要看免费一级毛片| 黄色片在线免费| 免费观看性欧美一级| 在线污污视污免费| 福利一区国产| 毛片在线免费观看网站| 美女网战色| 最新在线中文字幕| 久久99九九99九九99精品| 一级特黄女人生活片| 亚洲综合在线一区| 久久综合干| 四虎地址8848最新章节| 桃色视频网站| 亚洲a成人| 2022天天操| 国产高清在线91福利| 在线欧美精品二区三区| 精品国产麻豆免费人成网站| 在线视频a| 婷婷激情六月| 亚洲视频一二| 国产在线欧美精品中文一区| 亚洲 欧美 制服 丝腿| 日韩在线欧美| 最新欧美日韩| 日本精品一区二区三区在线视频 | 亚洲国产日韩欧美高清片a|