2019-08-19
玩資料視覺化, 經常需要從網頁上下載表格, 再轉成 csv。 以前就曾搜尋到 sebsauvage.net 上面的 html2csv.py, 後來忘記了; 最近又重新發現一次。 很簡單: python2 html2csv.py abc.html 它會把 abc.html 裡面的所有表格串在一起, 產生一個 abc.csv 。 如果有合併列或合併欄等等比較複雜的狀況, 還是需要後續處理, 但至少比自己寫 regexp 簡單多了。 全文完。 喂~ 這樣就結束? 這篇未免太 ㄌㄢˋ ㄩˊ ㄔㄨㄥ ㄕㄨˋ 了吧! [現在有同音異字的成語太多了, 我都不知道國字該怎麼寫才對...] 至少應該要交代一下如何取得 html 啊。 如果是大量的靜態網頁, 可以用 wget 或 lynx -dump 或 curl 取得。 有可能需要 設定 user agent 才不會被網站拒絕。 如果是
2019-08-10
有些 FB 網紅大大的頁面明明是公開的, 但讀者卻必須登入他自己的 FB 才能閱讀網紅大大的貼文。 這樣的設定對於保護隱私完全沒有幫助。 (事實上 「臉書上的隱私」 本來就只是一種幻想, 看看 性工作者身份暴露的故事 就知道臉書的可怕) 這只會犧牲自己的人氣幫 FB 換取更多的追蹤訪客的機會, 好像店長僱了一位街頭小弟幫你發商店傳單, 小弟卻對訪客說: 「你先加入XX幫, 才可以進來消費」 一樣, 仿佛又回到了十年前 網站自殘 -- 微軟綁架你的點閱率 的年代。 因為我是 無賴 不要臉的邊緣人, 不太會用 FB, 不太確定自己的 FB 是否也跟小英總統一樣設壞掉了? 總之如果讀者知道該如何更改這個設定, 讓沒有登入的訪客也能看自己的 FB 公開貼文, 麻煩分享一下, 讓這些網紅大大不再犧牲自己的人氣幫 FB 強迫推銷。 但是在那麼多網紅大大學會更改設定之前, 我們路過的訪客還是可以
2019-08-08
【2019年8月7日柏林報導】– 文件基金會發布了LibreOffice 6.3 版,擁有更佳的效能、更多新的功能,以及設法解決更多專有文件格式所帶來的問題:
  • 根據第一線使用者提供的檔案,Writer與Calc的效能提升了一個數量級:包括處理有不同書籤、表格、嵌入字型的文字文件,大型的ODS/XLSX試算表、用了 VLOOKUP 的試算表等,在載入與顯示時速度都變得更快。另外Calc儲存XLS檔的時候速度也變快了。
  • 從LibreOffice 6.2版加入的記事本工具列中的分頁標籤,現在在Writer、Calc、Impress與Draw中都可以使用了。如此使用者在寬螢幕的筆記型電腦上編輯文件、試算表與簡報時,可以有更多的空間。此外,Writer與Draw也加入了新的情境式單一介面。
  • Calc 中的公式列印入了一個新的下拉式元件來取代舊的工具,讓使用者可以快速使用常用的函數。另外加入了傅立葉FOURIER函數,用來計算陣列的離散傅立葉轉換。
  • 匯出PDF功能現在加入了標準PDF/A-2格式的支援,可以滿足某些組織對檔案長期儲存的要求。此外,透過Writer中的「表單」選單,簡化了可編輯的PDF表單的設計,強化了這個LibreOffice最強大的功能之一。
  • LibreOffice加入了一個「發布前編審」的功能,讓文件在匯出或發布以前,可以編輯要移除或隱藏敏感資料如個資的區域,列印或匯出PDF檔時即可直接覆蓋敏感資料,以便讓公司或組織符合個資保護法規。過去此功能需要額外的軟體進行,新版本的LibreOffice直接提供內建功能。
  • 在Windows平台上,加入了一個主控台模式,提供更好的輸出與錯誤代碼。如此在使用LibreOffice執行批次作業,如列印或轉換許多文件時更加容易。
  • 與微軟Office的專有格式檔案互通問題,在某些方面做了改進。包括匯出DOTX文件範本與XLSX試算表範本檔、從DOCX的drawingML群組形狀匯入圖表、從PPTX檔匯入SmartArt、保留在PowerPoint中編輯的空間,以及更好的與XLSX的樞紐分析表互通。
LibreOffice 6.3的新功能是由許多社群的貢獻者所開發:65% 的提交是由在諮詢委員會(Advisory Board)裡的公司,如Collabora, Red Hat 與 CIB,以及其他的組織所提供;另外35% 則是由個別志願者所提供。
除了開發以外,全球社群的志願者一起進行了其他重要的基本工作,像是品質管控、軟體在地化、使用者介面設計與使用者體驗討論、編修說明文件與系統,還有自由開源與開放文件格式標準的推動等等。關於LibreOffice 6.3的新功能,目前在YouTube上已經有影片說明:
關於個人使用者使用LibreOffice
LibreOffice 6.3 代表著開源辦公應用套裝軟體最新功能的先鋒。此版本適合對相關技術愛好者、早期導入者、與資深使用者採用。文件基金會將不會提供使用者任何技術上的支援,不過使用者仍然可以透過郵件論壇或是官方的Ask LibreOffice網站向其他社群使用者尋求協助。

對於主要用於個人文件處理,因此希望使用經歷更多測試和錯誤修復的版本的使用者,文件基金會仍持續提供LibreOffice 6.2系列。此系列會包括數個月的新功能移植與錯誤修復。目前此一系列最新的版本是LibreOffice 6.2.5。關於企業使用LibreOffice對於佈署使用LibreOffice的企業,文件基金會強力建議尋求LibreOffice生態系的夥伴合作,以便取得長期支援的版本、個別的協助、客製化新功能與修復問題等支援,還有其他更多的益處。此外,生態系中夥伴所完成的工作也會回饋到上游LibreOffice專案,讓全世界每個人都能因此而受惠。
還有,企業可以透過認證過的導入專家與訓練專家,提供加值的服務並與國際社群接軌,也提供企業的資訊長與資訊經理人符合專有需求的解決方案。
實際上,LibreOffice擁有成熟穩定的程式碼、豐富的功能、對開放標準的強力支援、傑出的互通性與提供長期支援的認證夥伴,這代表著LibreOffice是在商務應用上一個理想的選擇,也讓企業免於受特定廠商套牢的風險。取得LibreOffice 6.3現在就可以透過以下連結取得LibreOffice 6.3 版:
https://www.libreoffice.org/download/
系統的最小需求為Microsoft Windows 7 SP1、Apple macOS 10.9或是一般Linux系統。最新的LibreOffice Online 程式碼的建構可以透過Docker images 取得:
https://hub.docker.com/r/libreoffice/online/
LibreOffice Online 基本上是一個伺服器服務,通常要與雲端儲存方案一起建構、設定並取得SSL憑證。它也可以做為雲端服務提供者、或是企業與大型組織的私有雲的雲端編輯解決方案。
LibreOffice 使用者、自由軟體推廣者與社群成員可以透過捐款來支持文件基金會:
https://www.libreoffice.org/donate
LibreOffice 6.3 的文件格式轉換函式庫是由 Document Liberation 專案所提供:
https://www.documentliberation.org新聞素材包本新聞稿與背景文件(以混合式PDF格式提供,可以用LibreOffice開啟,當成一般ODT檔案編輯),以及高畫質圖片等新聞素材,可以由此下載:
https://nextcloud.documentfoundation.org/s/3B8ZecMNMcWcxHy亞洲地區聯絡窗口關於亞洲地區 ODF 的推動政策,以及政府、企業、非營利組織等導入 LibreOffice 的相關資訊,可以聯繫臺灣的 LibreOffice 認證導入專家(LibreOffice Migration Professional):
  • 翁佳驥先生(Franklin Weng <franklin@slat.org>)
  • 林毓能先生(Kevin Lin <kevin.linul@gmail.com>)
  • 孫賜萍先生(Eric Sun <eric629@gmail.com>)

2019-08-08
還記得小時候學的 (沒有刻度的) 直尺與圓規作圖嗎? 光用這兩個工具, 就可以畫出相似三角形、 三角形的外接圓/內切圓等等圖形。 這是很燒腦又很好玩的益智遊戲。 用電腦畫更好玩, 因為繪圖完成後, 你可以用滑鼠抓著原圖的頂點或圓心, 改變原圖 (例如三角形) 的大小/形狀/位置的同時, 看著衍生圖 (例如外接圓或內切圓) 跟著變動, 超有成就感! 十幾年前我寫過 DrGeo: 物理老師也會心動的幾何教學玩具。 後來 Dr. Geo 大改版; 幾個月前得知: 新版的 Dr. Geo 不僅支援中文顯示, 也支援中文輸入, 今天終於要來重寫一篇新版的介紹文了。 一、 欣賞現成作品 每學期上課都拿三角形外接圓來示範 Dr. Geo, 有點玩膩了。 今天換一下題目吧: 平面上給定線段 AB 及另一點 C。 以 A 為圓心, AB 為半徑, 畫一圓 O 。 求 「通過 C 點的圓 O 的
2019-08-03
完整的自然語言語音辨識很複雜; 但在很多應用場合中, 如果可以讓用戶以十來個簡單語音指令控制電器/電腦/apps, 就已經很方便了, 而想要訓練這樣的類神經網路, 門檻當然比完整的語音辨識低很多。 Simple Audio Recognition (以下簡稱 SAR 一文) 所介紹的 tensorflow 原始碼當中的 speech_commands 範例, 就是這樣的工具。 餵一段一秒鐘的聲音, 它會判斷這是 "yes", "no", "up"、 "down"、 "left"、 "right"、 "on"、 "off"、 "stop"、 "go" 當中的哪一個語音命令, 或是未知的聲音 (UNKNOWN) 或是無聲 (SILENCE) (其實可能是很小聲的背景噪音)。 假設讀者已經先照著 貴哥的 colab 初學筆記 認識了 colab 的基本操作, 今天這篇文章將接續著帶大家
2019-07-31
LibreOffice 開發者喜歡深入了解程式碼,但他們也喜歡跟大家見面、交流想法、分享資訊,並享受美食!LibreOffice Asia Conference 2019 於5月25日與26日舉行,而現在簡報的影片已經上線了。來看看吧,一共有16部影片,您可以點入影片中來瀏覽播放清單……

(注意,這些影片也有放在 PeerTube 站臺上)

新聞來源:Video presentations from the LibreOffice Asia Conference 2019
2019-07-30
Google colaboratory 提供短暫 (數小時) 的免費雲端 GPU 算力, 真是深度學習初學者的福音啊! 前提是你要有 google drive 的帳號, 並且略會操作 Jupyter Notebook。 網路上已有很多入門教學文; 貴哥一看到有 shell 可用, 忍不住就好奇多探索一些, 於是也寫一篇自己的初學筆記。 基於 「站在巨人肩膀上」 的原則, 比較多人介紹的基本操作就只簡單帶過, 細節可參考 台大機械所 Wei-Hsiang Wang 的 Colab 基本操作筆記 (中文) 及 fuat 的 Google Colab Free GPU Tutorial (英文) 一、 試車 我看到的文件都說: 進 google drive、 進入一個任選的目錄、 按右鍵就會出現一個 「(建立) colaboratory (文件)」 的選項。 不知是不是因為
2019-07-25
文件基金會很高興地宣佈英國政府數位服務 (Government Digital Service,簡稱 GDS) 已加入專案的諮詢委員會,立即生效。

政府數位服務是英國內閣辦公室的一部份。它領導著英國政府的數位轉型,協助人們可以更容易與政府互動,並支援政府讓其更有效地運作。

2014年7月,英國內閣辦公室選擇開放文件格式來共享與檢視政府文件。

GDS 內的開放標準團隊支持並鼓勵在政府中使用開放標準,他們的目標是確定並貢獻關於軟體互操作性的開放標準,並推廣有助於滿足英國政府使用者需求的資料格式,以及通用元件的傳遞。

「GDS 一直是採用開放文件格式長久以來的支持者,他們參與文件基金會的諮詢委員會就是對專案推動開放標準與開放文件格式的堅定支持」,文件基金會董事 Simon Phipps 如此說道。

GDS 服務設計與保證臨時主任,John Strudwick 表示:「GDS 很高興加入文件基金會的諮詢委員會。我們相信開放標準對滿足政府使用者的需求來說非常重要,ODF 在協助實現這個目標方面有著相當重要的作用。」

文件基金會諮詢委員會的主要功能就是代表專案的支持者,並向董事會提供建議與指導。此外,諮詢委員會是 LibreOffice 生態系的核心,因此是專案進一步發展的關鍵。

新聞來源:UK Government Digital Service joins The Document Foundation Advisory Board
2019-07-09
不太確定為什麼, 偶爾會遇到 docker pull 抓映像檔抓到一半突然卡住不動。 很多人都遇過相同的問題, 而且很多年了都沒有解決, 到現在 Bounty Source 還在懸賞。 我在電腦教室特別常遇到這個問題; 可惜上課期間來不及研究。 這篇的目的是希望下次再遇到時, 可以做一些實驗, 確認一下到底是伺服器那頭的問題, 還是我們這頭的問題。 如果夠多人測試不同的排列組合, 並且到上述 issue 回報自己的排列組合, 說不定對開發者除錯會有一些幫助。 以下提到設定檔的地方, 都以 lubuntu 18.04 bionic beaver 為準。 一、 禁止平行下載 我曾經遇過: 用 ctrl-c 把自己的下載中斷掉, 學生們的下載就突然繼續動起來了。 所以跟 這個回答 有相同的猜測: 設定禁止平行下載有沒有用? 編輯 /etc/docker/daemon.json
2019-07-05
LibreOffice 6.3 預計將於2019年8月上旬釋出,包含了許多新功能,已經實作的部份可於 release notes 頁面上看到,當然,還有更多新功能。

QA 團隊將會在7月8日舉辦 LibreOffice 6.3 的第二個臭蟲狩獵會議,其將會檢查 LibreOffice 6.3 RC1,會在活動的前幾天放上預發佈伺服器,並可供 Linux(提供 deb 與 rpm 軟體包)、macOS 與 Windows 使用,但其將會取代您現有的安裝。

在7月8日當天,導師會在 UTC 早上7點至晚上7點(亦即臺灣時間的8日下午3點至9日的凌晨3點),經由 QA 團隊的 IRC 頻道及郵件列表協助經驗較少的志願者分類臭蟲。當然,您也可以在其它時間協助測試 LibreOffice 6.3.0 RC1,其將會在預發佈伺服器上放到7月中。

新聞來源:Coming up: Second Bug Hunting Session for LibreOffice 6.3, on July 08

軟體自由運動 需要您的支持!

數位路平

軟體自由推動成果:數位路平

為向政府單位宣導開放文件格式,軟體自由協會在 2015 年主辦了「數位路平★台灣騎跡」縣市政府宣導活動,成員們以單車為交通工具,騎車到西部及離島的各縣市政府前,大聲的說出我們追求數位路平的心聲。

捐款給SLAT

若您肯定協會多年來的努力,敬請捐款支持軟體自由運動!

立即捐款
自由軟體納入檢定

軟體自由推動成果:自由軟體納入國家技能檢定

2016 年,軟體自由協會向國家技能檢定中心要求檢討考場預裝軟體的規定,並將自由軟體納入選項中。在經過數場會議之後,技檢中心終於在 2017 年 8 月底公佈修正草案,這對考生的選擇自由、技職體系的教育公平性來說,都是非常大的進步。

捐款給SLAT

若您肯定協會多年來的努力,敬請捐款支持軟體自由運動!

立即捐款
training of ODF

軟體自由推動成果:協助推廣開放格式文件

自從 2015 年國發會開始「推動ODF為政府文件標準格式」之計劃以來,台灣各縣市政府已逐步落實開放格式文件的使用,能有這麼亮眼的成果,軟體自由協會的夥伴們是不可或缺的幕後功臣

捐款給SLAT

若您肯定協會多年來的努力,敬請捐款支持軟體自由運動!

立即捐款
ezgo saminar

軟體自由推動成果:專屬教育現場的自由軟體體驗包

"ezgo" 是軟體自由協會以 Kubuntu 為基礎而打造的「自由軟體體驗包」,包含了各種適合日常工作使用的自由軟體,以及豐富的教育類軟體和自由教材,是一套專為教育現場打造的作業系統。

捐款給SLAT

若您肯定協會多年來的努力,敬請捐款支持軟體自由運動!

立即捐款