take screenshot before running behavior (but after login) - thanks danielbicho

2025-08-01 19:16:15 -04:00 · 2017-02-15 09:13:44 -08:00 · 2017-02-15 09:13:44 -08:00 · 1054e8e3cb
commit 1054e8e3cb
parent e58f4b7c44
2 changed files with 4 additions and 16 deletions
--- a/brozzler/browser.py
+++ b/brozzler/browser.py
@ -426,13 +426,12 @@ class Browser:
                    user_agent=user_agent, timeout=300)
            if password:
                self.try_login(username, password, timeout=300)
+            if on_screenshot:
+                jpeg_bytes = self.screenshot()
+                on_screenshot(jpeg_bytes)
            behavior_script = brozzler.behavior_script(
                    page_url, behavior_parameters)
            self.run_behavior(behavior_script, timeout=900)
-            if on_screenshot:
-                self.scroll_to_top()
-                jpeg_bytes = self.screenshot()
-                on_screenshot(jpeg_bytes)
            outlinks = self.extract_outlinks()
            ## for each hashtag not already visited:
            ##     navigate_to_hashtag (nothing to wait for so no timeout?)
@ -502,17 +501,6 @@ class Browser:
        jpeg_bytes = base64.b64decode(message['result']['data'])
        return jpeg_bytes

-    def scroll_to_top(self, timeout=30):
-        self.logger.info('scrolling to top')
-        self.websock_thread.expect_result(self._command_id.peek())
-        msg_id = self.send_to_chrome(
-                    method='Runtime.evaluate',
-                    params={'expression': 'window.scrollTo(0, 0);'})
-        self._wait_for(
-                lambda: self.websock_thread.received_result(msg_id),
-                timeout=timeout)
-        self.websock_thread.pop_result(msg_id)
-
    def url(self, timeout=30):
        '''
        Returns value of document.URL from the browser.
--- a/setup.py
+++ b/setup.py
@ -32,7 +32,7 @@ def find_package_data(package):

 setuptools.setup(
        name='brozzler',
-        version='1.1b9.dev186',
+        version='1.1b9.dev187',
        description='Distributed web crawling with browsers',
        url='https://github.com/internetarchive/brozzler',
        author='Noah Levitt',