發表文章

目前顯示的是 4月, 2021的文章

陳韻伃期中考UNICODE對照表, EXCEL 函數, 從WEB讀入

圖片
來源 : http://www.tamasoft.co.jp/en/general-info/unicode.html 9F80 龀 龁 龂 龃 龄 龅 龆 龇 龈 龉 龊 龋 龌 龍 龎 龏 龐 龑 龒 龓 龔 龕 龖 龗 龘 龙 龚 龛 龜 龝 龞 龟   9FA0 龠 龡 龢 龣 龤 龥 龦 龧 龨 龩 龪 龫 龬 龭 龮 龯 龰 龱 龲 龳 龴 龵 龶 龷 龸 龹 龺 龻 龼 龽 龾 龿   9FC0 鿀 鿁 鿂 鿃 鿄 鿅 鿆 鿇 鿈 鿉 鿊 鿋 鿌 鿍 鿎 鿏 鿐 鿑 鿒 鿓 鿔 鿕 鿖 鿗 鿘 鿙 鿚 鿛 鿜 鿝 鿞 鿟   「鿀」的 Unihan資料 Unicode 編碼: 十進制:40896 UTF-8:E9 BF 80  UTF-16:9FC0 UTF-32:00009FC0 老師的影片 上次的成果

EXCEL函數LEN產生POWER QUERY效果認識漢字20950個

圖片
換列Feed Line字元碼10 使用EXCEL 2016資料Data,讀取外部資料External Data,從WEB,以第一筆資料「蘋果 Apple INC」,為例他  EXCEL 2016將他當作兩列 EXCEL 2019將他 當作一列,中間插入換列控制碼CHAR(10) EXCEL365的做法和EXCEL 2019相同 資料從表格,排序 漢字20950個的UNICODE 龍 40845 龎 40846 龏 40847 龐 40848 龑 40849 龒 40850 龓 40851 龔 40852 龕 40853 龖 40854 龗 40855 龘 40856 龙 40857 龚 40858 龛 40859 龜 40860 龝 40861 龞 40862 龟 40863 龠 40864 龡 40865 龢 40866 龣 40867 龤 40868 龥 40869 龦 40870 龧 40871 龨 40872 龩 40873 龪 40874 龫 40875 龬 40876 龭 40877 龮 40878 龯 40879 龰 40880 龱 40881 龲 40882 龳 40883 龴 40884 龵 40885 龶 40886 龷 40887 龸 40888 龹 40889 龺 40890 龻 40891 龼 40892 龽 40893 龾 40894 龿 40895 鿀 40896 鿁 40897 鿂 40898 鿃 40899 鿄 40900 鿅 40901 鿆 40902 鿇 40903 鿈 40904 鿉 40905 鿊 40906 鿋 40907 鿌 40908 鿍 40909 鿎 40910 鿏 40911 鿐 40912 鿑 40913 鿒 40914 鿓 40915 鿔 40916 鿕 40917

網路爬蟲的試探,網路機器學習的開始,EXCEL讀取外部資料WEB

圖片
劉任昌079影片 網路爬蟲   網路爬蟲 英語:web crawler,也叫網路蜘蛛(spider),是一種用來自動瀏覽全球資訊網的網路機器人。其目的一般為編纂網路索引。 網路搜尋引擎等站點通過爬蟲軟體更新自身的網站內容或其對其他網站的索引。網路爬蟲可以將自己所存取的頁面儲存下來,以便搜尋引擎事後生成索引供使用者搜尋。 爬蟲存取網站的過程會消耗目標系統資源。不少網路系統並不默許爬蟲工作。因此在存取大量頁面時,爬蟲需要考慮到規劃、負載,還需要講「禮貌」。 不願意被爬蟲存取、被爬蟲主人知曉的公開站點可以使用robots.txt檔案之類的方法避免存取。這個檔案可以要求機器人只對網站的一部分進行索引,或完全不作處理。 網際網路上的頁面極多,即使是最大的爬蟲系統也無法做出完整的索引。因此在公元2000年之前的全球資訊網出現初期,搜尋引擎經常找不到多少相關結果。現在的搜尋引擎在這方面已經進步很多,能夠即刻給出高品質結果。 爬蟲還可以驗證超連結和HTML代碼,用於網路抓取(參見資料驅動編程)。 A Web crawler, sometimes called a spider or spiderbot and often shortened to crawler, is an Internet bot that systematically browses the World Wide Web, typically operated by search engines for the purpose of Web indexing (web spidering).[1] Web search engines and some other websites use Web crawling or spidering software to update their web content or indices of other sites' web content. Web crawlers copy pages for processing by a search engine, which indexes the downloaded pages so that users can search more efficien...