自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

直接把任意網(wǎng)站變?yōu)?API 接口？Firecrawl有點牛了！

2024-07-18 12:41:49

開發(fā) 前端

Firecrawl 是一種 API 服務，它獲取 URL、對其進行抓取并將其轉(zhuǎn)換為干凈的 markdown 或結構化數(shù)據(jù)。我們會抓取所有可訪問的子頁面并為您提供每個子頁面的干凈數(shù)據(jù)。無需站點地圖。

Hello，大家好，我是 Sunday。

最近看到了一個爬蟲類框架：firecrawl 號稱可以抓取任何網(wǎng)站并將其轉(zhuǎn)換為干凈的 markdown 或結構化數(shù)據(jù)。并且可以直接通過 Node 進行部署。

看這樣的描述有點厲害了，所以，咱們今天就來看看這個 firecrawl

01：什么是 firecrawl

firecrawl 是一種 API 服務，它獲取 URL、對其進行抓取并將其轉(zhuǎn)換為干凈的 markdown 或結構化數(shù)據(jù)。我們會抓取所有可訪問的子頁面并為您提供每個子頁面的干凈數(shù)據(jù)。無需站點地圖。

目前 Firecrawl 開源 3周的時間，已經(jīng)有了 7.9K 的 star 數(shù)，可以說是一個優(yōu)秀的項目了

圖片

02：如何使用 firecrawl

想要使用 firecrawl ，那么首先需要獲取 API 秘鑰。秘鑰分為收費和免費兩種，大家如果不在商業(yè)項目中使用，通過免費計劃即可

圖片

獲取秘鑰在這里注冊并獲?。篽ttps://www.firecrawl.dev/pricing

有了秘鑰之后，可以直接基于 Node 包創(chuàng)建項目即可：

安裝依賴包 npm install @mendable/firecrawl-js
將 API 密鑰設置為命名的環(huán)境變量FIRECRAWL_API_KEY或?qū)⑵渥鳛閰?shù)傳遞給FirecrawlApp類
如要抓取單個 URL ，可直接通過 scrapeUrl 方法

try {
  const url = "https://example.com";
  const scrapedData = await app.scrapeUrl(url);
  console.log(scrapedData);
} catch (error) {
  console.error("Error occurred while scraping:", error.message);
}

如要爬取網(wǎng)站信息，可以直接通過 crawlUrl 方法。該方法以起始 URL 和可選參數(shù)作為參數(shù)。該params參數(shù)允許您為抓取作業(yè)指定其他選項，例如要抓取的最大頁面數(shù)、允許的域和輸出格式。

const crawlUrl = "https://example.com";
const params = {
  crawlerOptions: {
    excludes: ["blog/"],
    includes: [], // leave empty for all pages
    limit: 1000,
  },
  pageOptions: {
    onlyMainContent: true,
  },
};
const waitUntilDone = true;
const timeout = 5;
const crawlResult = await app.crawlUrl(
  crawlUrl,
  params,
  waitUntilDone,
  timeout
);

可以通過 checkCrawlStatus 方法檢查爬取狀態(tài)

const status = await app.checkCrawlStatus(jobId);
console.log(status);

使用 LLM 可自動格式化所有數(shù)據(jù)

import FirecrawlApp from "@mendable/firecrawl-js";
import { z } from "zod";

const app = new FirecrawlApp({
  apiKey: "fc-YOUR_API_KEY",
});

// Define schema to extract contents into
const schema = z.object({
  top: z
    .array(
      z.object({
        title: z.string(),
        points: z.number(),
        by: z.string(),
        commentsURL: z.string(),
      })
    )
    .length(5)
    .describe("Top 5 stories on Hacker News"),
});

const scrapeResult = await app.scrapeUrl("https://news.ycombinator.com", {
  extractorOptions: { extractionSchema: schema },
});

console.log(scrapeResult.data["llm_extraction"]);

使用該 search 方法，您可以在搜索引擎中搜索查詢并獲取排名靠前的結果以及每個結果的頁面內(nèi)容。該方法將查詢作為參數(shù)并返回搜索結果。

const query = "what is mendable?";
const searchResults = await app.search(query, {
  pageOptions: {
    fetchPageContent: true, // 獲取每個搜索結果的頁面內(nèi)容
  },
});

責任編輯：武曉燕來源：程序員Sunday

相似話題


后端
 26350內(nèi)容

開發(fā)工具
 7413內(nèi)容

測試
 530內(nèi)容

游戲開發(fā)
654內(nèi)容
全部話題

同話題下的熱門內(nèi)容

SpringBoot 集成 Camunda 流程引擎，實現(xiàn)一套完整的業(yè)務流程招行二面：為什么需要序列化和反序列？為什么不能直接使用對象？顛覆配置加載！Spring Boot 3.4 全新 ConfigData 機制重磅升級 @JsonFormat 只會轉(zhuǎn)日期？這四個高能用法太強大了 SpringBoot 棄用 spring.factories：技術革新下的必然選擇新特性真香！Spring Boot 3.4 配置屬性驗證大升級，一文看懂接口冪等性設計：六種解決方法讓重復請求不再成為系統(tǒng)隱患更強大！Spring Boot 3.4 配置校驗新特性全解鎖

相關專題更多

解讀惠普Z系列工作站ZBook Ultra G1a高性能移動

HPE ProLiant DL145 Gen11 服務器解讀

2025-04-21 09:59:50

開發(fā)者成長學院 | 成長有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內(nèi)容

微博

QQ

微信

復制鏈接

微信掃碼分享

51CTO業(yè)務

媒體
51CTO CIOAge HC3i Techplur
社區(qū)
51CTO博客軟考社區(qū)鴻蒙開發(fā)者社區(qū)AI.x社區(qū)
教育
51CTO學堂精培企業(yè)培訓 CTO訓練營

51CTO學堂

51CTO學堂企業(yè)版

51CTO官微

51CTO

關于我們&條款

關于我們

新聞動態(tài)

站點地圖

意見反饋

English

用戶協(xié)議

隱私協(xié)議

北京市海淀區(qū)中關村南1條甲1號ECO中科愛克大廈6-7層

北京市公安局海淀分局備案編號：110108002980號
營業(yè)執(zhí)照京ICP備09067568號

Copyright ? 2005-2025 51CTO.COM 京ICP證060544 版權所有未經(jīng)許可請勿轉(zhuǎn)載

營業(yè)執(zhí)照出版物經(jīng)營許可證

友情鏈接

新浪科技騰訊科技網(wǎng)易科技鳳凰科技驅(qū)動科技科技行者 TechWeb 艾瑞網(wǎng)站長之家速途網(wǎng)中國經(jīng)濟新聞網(wǎng)IT之家工聯(lián)網(wǎng)極客公園 236視頻會議中國IDC圈企業(yè)網(wǎng)D1Net 投資界次方元火山引擎

51CTO技術棧公眾號

51CTO技術棧公眾號

業(yè)務
速覽

在線客服

媒體
51CTO CIOAge HC3i

社區(qū)
51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育
51CTO學堂精培企業(yè)培訓 CTO訓練營

感谢您访问我们的网站，您可能还对以下资源感兴趣：
自拍偷在线精品自拍偷