如何提取网页中的所有链接?
第一步,
打开Visual Studio 2019 ,如下图所示: 第二步,点击文件,新建项目,选择C#项目、Linux的控制台项目,如下图示:第三步,鼠标右键点击解决方案、项目下的依懒项,如下图所示:鼠标左键选择管理NuGet程序包,然后出现如下图界面:点击浏览,输入AngleSharp 名称,如下图所示:选择上图第一项,点击右侧的安装按钮,如下图所示:鼠标点击上图中的确定按钮,出现以下界面:表示已经将依懒项AngleSharp安装到了项目中,如下图所示:。第四步,右键双击解决方案项目下的Program.cs,打开源代码文件Program.cs,编写以下代码,using System;using System.Linq;using AngleSharp;using AngleSharp.Html.Dom; namespace ConsoleGetAllLink{ class Program { /// <summary> /// 读取网页的所有链接 /// </summary> static async void ReadAllLink() { //创建一个场景 var context = BrowsingContext.New(Configuration.Default.WithDefaultLoader()); //以异步方式打开hao123网址首页 var document = await context.OpenAsync("https://www.hao123.com/"); //查询hao123网址首页中所有的链接 var allLinks = document.All.Where(m => m.LocalName == "a"); //循环输出链接的名称和网址 foreach(var link in allLinks) { IHtmlAnchorElement ilink = link as IHtmlAnchorElement; Console.WriteLine($"{ilink.TextContent} ,{ilink.Href}"); } } static void Main(string[] args) { //读取网页的所有链接 ReadAllLink(); if(Console.ReadLine().ToLower() == "q") { } } }}第五步,按F5键调试运行,如下图所示:运行结果:。Copyright © 广州京杭网络科技有限公司 2005-2024 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有