Wydajny import produktów w Sitecore – część 1

Jednym z najczęstszych zadań podczas implementacji Sitecore jest import danych i zapisanie ich w Sitecore w postaci itemów. Przeważnie robi się to jeśli mamy zewnętrzny system PIM, gdzie zarządzamy jakiegoś typu produktami i chcemy wyświetlić je na naszej stronie, bez utraty wydajności spowodowanej ciągłą komunikacją z tym systemem. Przeważnie produkty wyświetla się z dodatkowymi informacjami, zarządzanymi bezpośrednio w Sitecore, takimi jak opisy rich text i obrazki. Dodatkowo chcemy skorzystać z personalizacji Sitecore. Oczywiście chcemy aby dane produktów zapisane w Sitecore były aktualne.

Kluczowym komponentem implementacji jest Sitecore scheduled task, który jest kombinacją itemów i naszego kodu. W pierwszej części tego poradnika skupimy się na stworzeniu task’a, w kolejnym poprawimy nasz kod dodając item bucket.

Item’y Scheduled task

Repozytorium produktów

Zaczynamy tworząc item, który będzie pełnił rolę repozytorium produktów. W naszym wypadku, jest to prosty item, nie posiadający żadnych niestandardowych pól:

Task Command

Ok, stwórzmy teraz item definiujący task command. Dodajemy go pod /sitecore/system/Tasks/Commands. W polu “Type” definiujemy lokalizację naszego kodu task’a, w formacie “namespace.class, assembly name”. W polu “Method” informujemy Sitecore, którą metodę z naszej klasy powinien zawołać.

Task schedule

Tworzymy teraz item definiujący schedule naszego taska w /sitecore/system/Task/Schedules. Ten item jest trochę bardziej skomplikowany. W polu “Command” wybieramy command item stworzony w poprzednim kroku. W polu “Items”, możemy podać ID itemów, oddzielone znakiem |, które chcemy przekazać do naszgo kodu, w naszym przypadku wpisujemy tam ID itemu repozytorium produktów stworzonego w pierwszym korku. W polu “Schedule” definiujemy kiedy task powienien być uruchomiony po raz pierwszy, ostatni i z jaką cząstotliwością Sitecor powinien go uruchamiać. Format pola to oddzielone znakiem |:

  • Pierwsza data uruchomienia w formacie yyyyMMdd
  • Ostatnia data uruchomienia w formacie yyyyMMdd
  • Dzień tygodnia, kiedy task powinien być uruchamiany, w formie mapy bitowej, gdzie:
    • 1=Niedziela
    • 2=Poniedziałek
    • 4=Wtorek
    • 8=Środa
    • 16=Czwartek
    • 32=Piątek
    • 64=Sobota
  • Czyli na przykład od poniedziałku do piątku to 62 a codziennie to 127
  • Przedział czasu pomiędzy kolejnymi uruchomieniami w formacie HH:mm:ss

Więc 19990101|21000101|127|01.00:00 oznacza wystartuj task od razu, uruchamiaj co godzinę do roku 2100.

Pole “Last run” informuje Sitecore’a (i nas) kiedy task był uruchamiany ostatnim razem. Pole jest automatyczne uaktualniane przez Sitecore. Więc żeby wymusić uruchomienie taska, możemy ustawić w tym polu datę w przeszłości i zapisać item.

Zaznaczenie “Async” oznacza, że kolejna instancja taska może być uruchomiona, jeśli poprzednia nie została zakończona. Zaznaczenie “Auto remove” spowoduje usunięcie itemu definiującego schedule, co wymusi jednokrotne uruchomienie taska. W naszym przypadku, zostawiamy oba niezaznaczone.

Konfiguracja Sitecore Scheduler’a

Możemy teraz zapytać, dlaczego nasz kod jest cyklicznie odpalany jeśli zdefiniujemy te item’y w Sitecore? Odpowiedzią jest scheduling agent zdefiniowany w konfiguracji Sitecore, który cyklicznie sprawdza itemy z definicjami scheduled tasków i uruchamia je. Swoją drogą scheduling agents są kolejnym sposobem na cykliczne uruchamianie kodu w Sitecore. Jeśli jesteś zainteresowany jak się ich używa, zapraszam do wpisu John’a Westa z odnośnika poniżej.

Agent nazywa się “Master_Database_Agent” typu “Sitecore.Tasks.DatabaseAgent”. W Sitecore 8.x jest zdefiniowany w pliku Sitecore.Processing.config. Ważne:

  • Plik powinien być wyłączony na środowiskach, na których nie chcemy uruchamiać tasków. Na przykład przeważnie wyłącza się ten plik na serwerach CD i Reporting.
  • Częstotliwość zdefiniowana w itemie w polu “Schedule” nie może być częstsza niż, ta zdefiniowana w pliku konfiguracyjnym w “interval”.

Domyślna konfiguracja wygląda następująco:

Kod Sitecore Scheduled Task’a

Jesteśmy teraz gotowi, żeby napisać trochę kodu, zaczynając od stworzenia publicznej klasy “ProductImporter” w namespace i assembly zdefiniowanej w task command item (w polu “Type”) i metody, o nazwie, którą wpisaliśmy w polu “Method”. Metoda musi być publiczna i posiadać trzy parametry:

  • items: lista itemów zdefiniowana w polu “Items” w itemie task schedule
  • command: item task command
  • schedule: item task schedule

Nasz kod jest uruchamiany na stronie zdefiniowanej jako “scheduler” w Sitecore.config w sekcji <sites>, bez context item’u, dlatego musimy przełączyć się na inną bazę (“master” w naszym wypadku). Aby uprościć dalszą implementację ustawiamy też context item na item naszego repozytorium produktu:

W metodzie RunImporter wołamy web service (productService.GetAll()), który zwraca produkty z zewnętrznego systemu, a następnie, w pętli dla każdego z nich, sprawdzamy czy produkt z tym samym, unikalnym kodem istnieje w repozytorium produktów w Sitecore. Jeśli nie, dodajemy nowy item, w przeciwnym wypadku uaktualniamy item, sprawdzając wcześniej czy timestamp (data utworzenia/ostatniej modyfikacji) zwrócony przez web service jest późniejszy od tego zapisanego w Sitecore.

Cały kod, powiązany z wołaniem web service’u jest w bloku try catch, ponieważ nie możemy w pełni ufać zewnętrznemu źródłu danych, które może nie być dostępne. Dodajemy również kod raportujący wydajność importera za pomocą klasy System.Diagnostics.StopWatch.

Sitecore IndexCustodian

Od razu wprowadzamy kod, poprawiający wydajność za pomocą Sitecore.ContentSearch.Maintenance.IndexCustodian, która jest wbudowaną w Sitecore pomocniczą klasą do zarządzania indeksami wyszukiwania.

To co zrobiliśmy to wstrzymanie indeksowania przed importem produktów (IndexCustodian.PauseIndexing) oraz wznowienie indeksowania po nim (IndexCustodian.ResumeIndexing).

Dodatkowo zapamiętujemy, które item’y były utworzone, lub zmienione i za jednym razem uaktualniamy je w indeksach wyszukiwania (IndexCustodian.IncrementalUpdate). W naszym wypadku tylko w indeksach powiązanych z bazą “Master”. To podejście może poprawić wydajność, jeśli zmieniamy dużą ilość itemów, używając domyślnej strategii uaktualniania indeksów, która synchronizuje je po każdej zmianie itemu.

Zapis itemu w Sitecore

Model danych użyty w naszym importerze jest bardzo prosty. Zakładamy, że z zewnętrznego systemu ładujemy unikalny kod i nazwę produktu. Dodatkowo każdy obiekt ma swój timestamp:

Odpowiadający modelowi template Sitecore:

Ostatni fragment naszego kody mapuje obiekt zwrócony przez web service na item w Sitecore. Zabezpieczamy kod w bloku try catch, w razie zmiany formatu oczekiwanych przez nas danych. Zakładamy że kody produktów są unikalne i używamy ich jako nazwy itemów. Dodatkowo, aby ułatwić pracę Content Editorów, ustawiamy DisplayName na kod i nazwę produktu.

Poprawienie bezpieczeństwa itemów produktów

Chcemy uniemożliwić manualną zmianę danych importowanych z zewnętrznego systemu przez edytorów. Aby to osiągnąć możemy użyć Sitecore security na itemach pól naszego template’u.  Powtarzamy to dla pozostałych, importowanych pól:

Możemy to przetestować, logując się do Sitecore’a jako edytor (ustawienia Sitecore security nie mają wpływu na konto administratora). Po zrobieniu check-in itemu produktu widzimy, że importowane pola pozostają tylko do odczytu, a pozostałe pola można edytować: