none
請問有沒有辦法抓到的IE,網站(已讀取完)的檢視原始碼內容C# WinForm? RRS feed

  • 問題

  • 1. 開啟IE瀏覽器

    2. 假設網頁讀取完,會顯示一個條碼(每次會隨機不同產生)

    我希望抓到這個已經產生完的驗證碼圖

    目前想到一個作法是

    1.抓取作用中IE

    2.記錄目前IE的 寬、高&位置

    3.強制將作用中的IE位置改成 x y 從0也就是從左上角開始然後寬、高也固定設定200

    4. *** 這時我就可以螢幕截圖後,抓那個隨機條碼的圖片位置,之後再分析圖....轉成值  ***

    5. 還原一開始IE瀏覽器所在的(寬、高、位置)

    想問問有沒有更好的作法

    感覺應該是有辦法抓到,目前已讀取完成的靜態IE內容原始碼才對?

    因為如果可以取道那個原始碼,我就能直接抓TAG的值,就不用分析圖片了。



    • 已編輯 天氣 2018年9月12日 上午 08:10
    2018年9月12日 上午 08:03

解答

所有回覆

  • 您可以參考這篇文件的做法:

    Reading a web page in C#

    2018年9月12日 上午 09:47
  • 不好意思可能我敘述的不夠詳細

    我想了一下我要做的事有點像,一個網站有隨機產生的驗證碼要你輸入,

    我希望能抓到那張「驗證碼的圖」,因為那個要等網頁執行完畢才會產生,

    然後因為那張網頁產生後,我分析玩圖片後,要在同一張產生出張亂數圖的網頁上面打東西。

    所以希望能ie一開,網頁讀取完畢後,我就能抓到圖進而我分析玩圖後,將分析的值貼到剪貼簿,

    我就可以直接點同張網頁上

    可以輸入的那個格子,直接把值貼上去@@。

    所以我上面一開始才想了一個方法,強制把瀏覽器高、寬定位,在螢幕截圖後抓那張亂數產生出來的圖的固定位置...>///< 

    但我感覺開啟 ie後 --> 連到a網頁 --> a網頁讀取玩後。應該會有一個實體的網頁檔案存在電腦裡?

    才想說是不是有辦法抓到那個檔案,這樣就可以抓他產生好的圖片或文字,這樣分析內容比較準



    • 已編輯 天氣 2018年9月12日 下午 12:46
    2018年9月12日 下午 12:45
  • 你是想要做破解驗證碼的程式?

    如果是,請自行找尋其他的討論區,這裡不允許討論與破解有關的議題。


    強力監督SQL Injection問題!!

      • 小朱的技術隨手寫:http://www.dotblogs.com.tw/regionbbs/
      • 雲端學堂Facebook: http://www.facebook.com/studyazure

    2018年9月12日 下午 02:04
    版主
  • 你是想要做破解驗證碼的程式?

    如果是,請自行找尋其他的討論區,這裡不允許討論與破解有關的議題。


    強力監督SQL Injection問題!!

      • 小朱的技術隨手寫:http://www.dotblogs.com.tw/regionbbs/
      • 雲端學堂Facebook: http://www.facebook.com/studyazure

    硬要說算是很類似,但不是破解驗證碼相關,

    我只是想抓到「已讀取完後的網頁上的照片跟文字」做分析,如果這個這樣有違反版歸議題,就不再討論了><。

    我照我目前那個作法做好了

    (就是強制給作用中IE固定位置,再抓固定位置,影像文字分析那些我自己有寫好幾個演算法100%沒問題了)。

    我是要做這件事,

    藥價網站

    我試想要能自動找到位置,輸入條件資料,查出來資料後,可以抓他的即時藥價...資料之類的。

    這樣我就可以找查,目前我們有的即時藥價之類的

    1.連到網站後

    2.自動輸入我要查的品項「ex:特材」

    3.自動點「開始查詢」

    4.等他查詢結果出來後,我要抓「支付點數」跟「生效日期」




    • 已編輯 天氣 2018年9月13日 上午 02:45
    2018年9月13日 上午 01:11
  • 你自己 google 妨害電腦使用罪,以電腦程式自動填入網頁取得資料的行為,若未經網站管理單位許可,就算妨害電腦使用罪。

    一般允許你這樣做的,通常可以申請對應的串接口,沒有允許你的,就是屬於可做不可說,說了不可做。


    不精確的問法,就會得到隨便猜的答案;自己都不肯花時間好好描述問題,又何必期望網友會認真回答?

    2018年9月13日 上午 11:19
  • 是歐@@ 還真得不知道有這個耶,我以為開放對外查詢,都可以隨便你查?

    我剛剛google看它是寫「破解人家帳號、密碼」跟「入侵他人電腦」,

    但沒有要破解跟入侵人家電腦啊? 對外開放的查詢平台。所以這樣也算?

    那像Google翻譯,自己在後面網址參數換成要翻譯的參數(%s),快速翻譯,

    https://translate.google.com/#auto/zh-TW/%s

    不透過google 翻譯網頁翻的話,也算妨礙電腦使用罪?




    • 已編輯 天氣 2018年9月14日 上午 12:25
    2018年9月14日 上午 12:18
  • http://html-agility-pack.net 你應該是需要這個。

    但比較正式,應該還是發文去問有無 API 串接,不是更好。


    理直氣和,切記。

    個人

    • 已標示為解答 天氣 2018年9月14日 上午 03:25
    2018年9月14日 上午 02:53
  • http://html-agility-pack.net 你應該是需要這個。

    但比較正式,應該還是發文去問有無 API 串接,不是更好。


    理直氣和,切記。

    個人

    感謝 kk 分享

    然後我想說

    我當然希望有提供api可以串接....就是沒有... 在醫療業做很久了,跟政府單位..等接觸很多次

    通常都是沒下文居多......

    我會再請需求單位在發文去問一次看看,但結果應該一樣Zzzzz

    ---

    舉一個幾年碰到的例子,健保局某年要求在開安眠藥的時候要強置插雙卡連到健保局提供的站去查,

    是不是在別家有開過,要管控數量,能不能開。

    結果呢?健保局提供個這查詢api,有連過上去看過,又不回傳值丟回來....

    (寫信過無數次,醫學中心層級一樣敷衍你,回說好會改會加,到現在還是沒有耶???)

    醫師在看診過程中,有很多因素會導致他,只點了一下,看了一下,

    秒關,然後就被健保局說沒仔細查看,就開就核刪你申請的費用...

    最後怎麼辦?

    只好自己被逼到發明出一套影像分析系統來紀錄,是否有查閱過、有看了n秒...等的紀錄。

    ---

    根本懷疑政府單位不是沒人才,就是沒人力。

    從小地方就可以發現,要求上傳的電子檔格式,到現在還在用過時的.csv就算了

    還是big5編碼(會有什麼問題全世界都知道......),所以才說不是沒人能力,就是沒人力...

    要解決這個問題有合難度?。
    改寫一下匯入資料的程式,花不到一天吧。
    在公告全國,某年某月開始改用新的 Unicode 檔案格式就好了啊

    **************************************************************

    另外我不經還是想問,上面人提到

    妨害電腦使用罪,以電腦程式自動填入網頁取得資料的行為,若未經網站管理單位許可,就算妨害電腦使用罪。

    不是開放對外查詢的平台,都隨便你查嗎?

    然後我google看它是寫「破解人家帳號、密碼」跟「入侵他人電腦」,但沒有要破解跟入侵人家電腦啊?

    對外開放的查詢平台。所以這樣也算,看起來沒有相關啊@@?

    像Google翻譯,自己在後面網址參數換成要翻譯的參數(%s),快速翻譯,

    https://translate.google.com/#auto/zh-TW/%s

    不透過google 翻譯網頁翻的話,也算妨礙電腦使用罪?

    因為很少有學習到這方面的知識,想請教一下這方面的知識。



    • 已編輯 天氣 2018年9月14日 下午 01:16
    2018年9月14日 下午 12:39
  • 妨害電腦使用罪為告訴乃論,不告不理。

    網址一般認為是提供人機使用,所以不是透過機器人處理,不會認為不當使用,若使用 Google API ,API 一般認為是提供機器使用,所以 API 一定沒問題。而回頭來說,使用網址時,若 google 認為遭到損害 (參考妨害電腦使用罪) ,就可以提告,google 一般是放個辨識圖形用機器阻擋,根本懶得理你,有圖形辨識這種,當使用機器人去處理時,就很明確是屬於妨害電腦使用罪,因為對方設計上就不給你這樣用。

    所以才說,你 google 一下案例,就可以找到,也有很多律師有提出他的法律見解可以參考。

    是否授權,以網站管理單位說了算,例如他提供網頁形式的 API 或是說明文件也算是授權,但沒提供的,都不能解釋為設計行為,即使你猜出參數怎樣用。

    之前在公司碰上一個案例,政府單位的地籍圖查詢系統支援滑鼠縮放,滑鼠縮放時,每個動作都會透過 AJAX 觸發一個 http GET ,有次公司被鎖 IP ,打電話去問,轉接到委外的代管公司後,對方查詢後,說我公司在半小時內,有超過 8000 次連結要求,認為我公司涉及妨害電腦使用,鎖 IP 作為警告,並保留法律追訴權 (暗示我公司自投羅網) 。找來操作該網頁的助理詢問操作步驟,並用外網測試後,根本是設計問題,滑鼠滾輪滾兩下就上百個 http GET,用錄畫面的軟體錄影 IE 進入網站,開啟 IE 除錯工具,正常操作 1 分鐘,切換 IE 除錯工具檢視 http GET 。推算約 15 分鐘就會超過 8000 次連結要求,把資料佐證發回去,對方就解鎖了。

    只有在設計行為下的操作,不涉及妨害電腦使用罪,而不是覺得網只是開放的,就不涉及妨害電腦使用罪。


    不精確的問法,就會得到隨便猜的答案;自己都不肯花時間好好描述問題,又何必期望網友會認真回答?

    2018年9月14日 下午 06:39
  • 最簡單的案例是很多網站搶票系統並沒有

    破解帳密

    入侵

    的行為,但還是被認定為妨害電腦使用罪,是因為認為用機器人搶票,非網頁設定人機存取方式。


    不精確的問法,就會得到隨便猜的答案;自己都不肯花時間好好描述問題,又何必期望網友會認真回答?

    2018年9月14日 下午 06:43
  • DDoS 攻擊也是類似,用合理的資源連結提出要求,但大量提出時,就會被視為惡意攻擊,如果人工一直大量無理使用瀏覽器重整,就有可能被告妨礙電腦使用罪,因為一直重整瀏覽器並不是正常的設計行為,但若能提出是瀏覽器自己的 bug 或是網站的 bug ,就會不成立。

    不精確的問法,就會得到隨便猜的答案;自己都不肯花時間好好描述問題,又何必期望網友會認真回答?

    2018年9月14日 下午 06:49