Хорошо, мы являемся крупным продавцом автозапчастей. Нам нужно войти (разные логины для каждого и разных доменов) на 15 веб-сайтах разных поставщиков, чтобы получить информацию о продуктах, выполнив поиск в SKU, чтобы получить информацию о ценах и запасах. На всех сайтах используются типичные поисковые структуры (и т. Д. / Search? SKU = FSA9FSDF), поэтому можно было бы закодировать сценарий, автоматизирующий поиск по поставщику, хотя редизайн сайта будет вызывать проблемы здесь и там. Получение информации о ценах и запасах и присвоение переменных также не должно быть проблемой.
Вот то, что наш разработчик говорит нам, что проблема будет
Чтобы автоматизировать этот процесс получения цены продукта с сайтов поставщиков, нам нужно иметь> доступ к их API или каким-либо конечным точкам, которые можно вызывать непосредственно из> скрипта.
На странице входа это не может быть автоматизировано, так как cookie-файл сеанса потребуется для проверки> статуса входа пользователя.
Для большинства сайтов нет API. Должен быть какой-то способ сделать это, так как наш персонал делает это чрезвычайно трудоемким и дорогостоящим процессом и время от времени вызывает ошибки.
Мы также можем использовать другие языки программирования для достижения этой цели, если это необходимо.
На самом деле, ваш разработчик прав. Когда конечные точки и / или API не существуют, нам обычно приходится прибегать к очистке экрана, извлечению информации из электронных писем или проверке, могут ли сторонние системы удалить «файл поиска» на FTP или WEBDAV, где ваш Затем приложение будет опрашивать местоположение FTP или WEBDAV с определенной частотой, приемлемой для вас и ваших рабочих процессов.
Мы сами прошли через это, но в другой отрасли: в строительстве.
Кроме того, это хорошая идея, чтобы позвонить каждому из этих поставщиков, чтобы узнать, что они предлагают. Вы можете быть удивлены, узнав, что они каким-то образом пытаются разоблачить свои данные. Как минимум, они могут иметь базы данных на DVD. Это немного старомодный, но, как правило, кусок пирога для импорта данных в этом сценарии.
Последнее предложение: может быть третья сторона (под «третьей» я имею в виду сторону, совершенно отличную от любого из ваших поставщиков), которая объединяет эти данные и предлагает какой-то продукт данных.
Вы можете связаться с поставщиками, надеясь, что они будут размещены, я бы высказался с осторожностью и не обсуждал варианты очистки; но я думаю, что в зависимости от ситуации вам лучше всего найти специалиста по автоматизации, с которым вы сможете создавать связи, чтобы ускорить и повысить точность процесса. Когда компьютер делает что-то, он может быть в сотни тысяч раз быстрее, чем люди, выполняющие тот же процесс, и, хотя компьютеры и программирование стоят, они обычно работают только потому, что экономят деньги.
Не все программисты будут готовы к этой задаче, и сотни претендентов, вероятно, будут плохо владеть содержанием, обходными путями и т. Д. Я бы посоветовал молчать об очистке сайтов, так как это может привести к бану. Посмотрим правде в глаза, некоторые поставщики не видят возможности. Мне даже пришлось помочь одному клиенту электронной коммерции соскрести изображения, описания, видео и размеры YouTube со своего сайта в 2013 году, потому что злобный поставщик ERP не предоставил бы доступ к информации осмысленным образом … К сожалению, это мир, в котором мы живем.
Если у вас появился настоящий программист, его, скорее всего, нужно будет поместить в держатель после первоначального проекта, чтобы не отставать от изменений во внешних службах, но если сторонние организации хотят, чтобы весь трафик проходил через них, и не Если вы хотите предоставить API, это, вероятно, все еще лучший вариант по сравнению с минимальной заработной платой.
Комментарии Shawns также действительны, но если вы получите скребок, который знает, что они делают, вам нечего бояться, так как у них будут инструменты, чтобы сделать вещи подлинными!
Надеюсь это поможет