Cas d'usage

Parcourir et capturer un site entier en un seul appel API

Lancez un crawl avec captures en un seul appel. Indiquez domaine et URL de départ — le robot découvre les pages, les capture et renvoie les images à la fin. Sans liste d’URL ni export sitemap.

Commencer gratuitement Lire la doc API

1000

URL max par crawl

80+

Pays disponibles

Auto

Découverte des liens

Fonctionnement

Du domaine aux captures en quatre étapes

L’API découvre les pages en suivant les liens du domaine, puis capture chacune. Vous définissez l’URL de départ et les options une fois.

Domaine et URL de départ

Indiquez le domaine (ex. example.com) et l’URL où commence la découverte. Le robot suit les liens internes au domaine.

POST vers /crawl/create

Corps JSON avec url, domain et max_urls. Options : pays, taille, délai, navigateur, etc. Réponse immédiate avec identifiant de crawl.

Suivi du statut

Appelez /crawl/info avec l’ID : statut (processing, finished, cancelled, error), total_discovered, processed, failed.

Captures via /crawl/info

Quand le statut est « finished », la réponse inclut un tableau screenshots (URL, image, métadonnées).

Exemple API

Créer un crawl et attendre la fin

Envoyez du JSON à /crawl/create avec url, domain et max_urls. Interrogez /crawl/info jusqu’à status "finished".

# 1. Create the crawl
curl -X POST "https://api.screenshotcenter.com/api/v1/crawl/create?key=YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com", "domain": "example.com", "max_urls": 100}'
# => { "data": { "id": 12345, "status": "processing", ... } }

# 2. Poll for status and screenshots
curl "https://api.screenshotcenter.com/api/v1/crawl/info?key=YOUR_API_KEY&id=12345"
# => { "data": { "status": "finished", "processed": 98, "screenshots": [...] } }

import { ScreenshotCenterClient } from 'screenshotcenter';

const client = new ScreenshotCenterClient({ apiKey: 'YOUR_API_KEY' });

const crawl = await client.crawl.create('https://example.com', 'example.com', 100);

const result = await client.crawl.waitFor(crawl.id);
console.log(`Done — ${result.processed} screenshots`);
result.screenshots.forEach((s) => console.log(s.url, s.image_url));

from screenshotcenter import ScreenshotCenterClient

client = ScreenshotCenterClient(api_key="YOUR_API_KEY")

crawl  = client.crawl.create("https://example.com", "example.com", 100)
result = client.crawl.wait_for(crawl["id"], timeout=300)
print(f"Done — {result['processed']} screenshots")
for s in result.get("screenshots", []):
    print(s["url"], s["image_url"])

use ScreenshotCenter\Client;

$client = new Client(getenv('SCREENSHOTCENTER_API_KEY'));

$crawl  = $client->crawl->create('https://example.com', 'example.com', 100);
$result = $client->crawl->waitFor($crawl['id']);
echo "Done — {$result['processed']} screenshots\n";
foreach ($result['screenshots'] ?? [] as $s) {
    echo $s['url'], ' ', $s['image_url'], "\n";
}

import (
    "fmt"
    sc "github.com/juliensobrier/screenshotcenter-go"
)

client := sc.New("YOUR_API_KEY")

crawl, _  := client.Crawl.Create("https://example.com", "example.com", 100, nil)
result, _ := client.Crawl.WaitFor(crawl.ID, nil)
fmt.Printf("Done — %d screenshots\n", result.Processed)
for _, s := range result.Screenshots {
    fmt.Println(s.URL, s.ImageURL)
}

require "screenshotcenter"

client = ScreenshotCenter::Client.new(ENV["SCREENSHOTCENTER_API_KEY"])

crawl  = client.crawl.create("https://example.com", "example.com", 100)
result = client.crawl.wait_for(crawl["id"])
puts "Done — #{result['processed']} screenshots"
(result["screenshots"] || []).each { |s| puts "#{s['url']} #{s['image_url']}" }

import io.screenshotcenter.ScreenshotCenterClient;

public class Main {
    public static void main(String[] args) throws Exception {
        var client = new ScreenshotCenterClient("YOUR_API_KEY");
        var crawl  = client.crawl().create("https://example.com", "example.com", 100);

        var result = client.crawl().waitFor(crawl.getId());
        System.out.printf("Done — %d screenshots%n", result.getProcessed());
        result.getScreenshots().forEach(s ->
            System.out.println(s.getUrl() + " " + s.getImageUrl()));
    }
}

using ScreenshotCenter;

var client = new ScreenshotCenterClient("YOUR_API_KEY");

var crawl  = await client.Crawl.CreateAsync("https://example.com", "example.com", 100);
var result = await client.Crawl.WaitForAsync(crawl.Id);
Console.WriteLine($"Done — {result.Processed} screenshots");
foreach (var s in result.Screenshots ?? Array.Empty<Screenshot>())
    Console.WriteLine($"{s.Url} {s.ImageUrl}");

Cas d'usage

À quoi sert le crawl

Remplace les audits manuels par un seul appel API. Pas d’export sitemap ni de liste d’URL — seulement domaine et point d’entrée.

🔄

QA migration

Crawlez la préprod avant mise en ligne et comparez à la production. Liens cassés, assets manquants, régressions visuelles sur toutes les pages découvertes.

→Audit visuel pré-lancement
→Staging vs production
→Chaînes de redirection et liens internes

🔍

Audits SEO

Découvrez et capturez les pages indexables pour l’analyse SEO. Contenu pauvre, gabarits dupliqués, problèmes de rendu.

→Crawl technique complet
→Pages au rendu incohérent
→Inventaire visuel crawlable

🖼️

Tests de régression visuelle

Crawls périodiques pour baseline et détection de changements. CSS, mise en page, contenu.

→Diff visuel site entier
→Régressions après déploiement
→Cohérence des gabarits

📊

Veille concurrentielle

Structure, refontes et évolution du contenu. Archives visuelles pour intelligence marché.

→Home et landings clés
→Suivi dans le temps
→Archive pour analyse

⚖️

Archivage conformité

Politiques, CGU, mentions légales sur tout le domaine. Archive horodatée sans capture manuelle page par page.

→Politiques sur planning
→Divulgations pour dossiers réglementaires
→Preuves audit/contrat

📂

Inventaire de contenu

Vue de toutes les pages : orphelines, anciennes URL, contenu dynamique absent du sitemap.

→Audit contenu avec preuve visuelle
→Pages oubliées
→Sitemap visuel pour gros sites

Paramètres crawl

Paramètres principaux

Obligatoires : url, domain, max_urls. Les options screenshot standard s’appliquent à chaque page.

Paramètre	Obligatoire	Description
url	obligatoire	URL de départ complète (ex. https://example.com).
domain	obligatoire	Domaine exploré. Les liens externes ne sont pas suivis.
max_urls	obligatoire	Nombre max de pages à capturer. Entre 1 et 1000.
country	optionnel	Code pays ISO pour le navigateur. Défaut « us ».
size	optionnel	« screen » ou « page » (page entière).
screen_width	optionnel	Largeur viewport en pixels. Défaut : 1024.
delay	optionnel	Secondes après chargement avant capture.
browser	optionnel	« chromium », « firefox » ou « webkit ».
hide_ads	optionnel	Masquer pubs et bannières cookies.
format	optionnel	« png », « jpeg », « webp » ou « pdf ».

Lancez votre premier crawl

500 captures gratuites pour tester. Sans carte bancaire. Un domaine et c’est parti en quelques minutes.

Créer un compte gratuit Lire la doc API Tous les cas d’usage

Questions fréquentes

Qu'est-ce que le crawl de site ?

Une API qui découvre et capture les pages d’un domaine. À partir d’une URL et d’un domaine, le robot suit les liens internes jusqu’à la limite max_urls.

Comment fonctionne la découverte ?

Départ sur votre URL, suivi des liens (a, area) du même domaine, respect de robots.txt, pas de doublons, ordre largeur d’abord, file de captures.

Limite max_urls ?

Entre 1 et 1000 captures par crawl. Le robot peut découvrir plus d’URL ; il s’arrête à la limite. Pour les très gros sites, enchaînez plusieurs crawls ou changez l’URL de départ.

Puis-je annuler ?

Oui. POST /crawl/cancel avec l’ID. Fin de découverte et de traitement des jobs en attente. Les captures déjà faites restent accessibles via /crawl/info.

Captures conservées après annulation ?

Oui. Le tableau screenshots dans /crawl/info liste tout ce qui était terminé avant l’annulation.

Quels domaines ?

Tout domaine public, robots.txt respecté, liens limités au domaine indiqué. Les sous-domaines sont séparés : blog.example.com et www.example.com = crawls distincts.

Voir aussi

API Screenshot API captures par lots Sauvegarde visuelle du site Extraction de données sur pages web Captures pour audit SEO Intégration S3 Intégration Dropbox Guide de démarrage