Fix UnicodeDecodeError exception catching.

`str_lines` is a generator object, it won't be executed until Tokenizer() uses it. PiperOrigin-RevId: 499824005
2 years ago · 258d67c0d3
parent b4811c3ffb
commit 258d67c0d3
2 changed files with 8 additions and 2 deletions
--- a/python/google/protobuf/internal/text_format_test.py
+++ b/python/google/protobuf/internal/text_format_test.py
@ -786,6 +786,12 @@ class TextFormatParserTests(TextFormatBase):
    self.assertEqual(message_module.TestAllTypes(), message)
  def testParseInvalidUtf8(self, message_module):
    message = message_module.TestAllTypes()
    text = b'invalid<\xc3\xc3>'
    with self.assertRaises(text_format.ParseError):
      text_format.Parse(text, message)
  def testParseInvalidUtf8Value(self, message_module):
    message = message_module.TestAllTypes()
    text = 'repeated_string: "\\xc3\\xc3"'
    with self.assertRaises(text_format.ParseError) as e:
--- a/python/google/protobuf/text_format.py
+++ b/python/google/protobuf/text_format.py
@ -859,9 +859,9 @@ class _Parser(object):
      str_lines = (
          line if isinstance(line, str) else line.decode('utf-8')
          for line in lines)
    except UnicodeDecodeError as e:
      raise self._StringParseError(e)
      tokenizer = Tokenizer(str_lines)
    except UnicodeDecodeError as e:
      raise ParseError from e
    if message:
      self.root_type = message.DESCRIPTOR.full_name
    while not tokenizer.AtEnd():