Been focusing on 3.1.1, what we found is that the attached script returns:<br>&#39;\ud801\udc51&#39;<br>&#39;\U00010451&#39;<br><br>This was attached to ensure it transfers properly over the email list :-)<br><br>And, sadly, the workaround is adding .encode(&#39;utf-16&#39;).decode(&#39;utf-16&#39;).  It appears that utf-8 support is bugged.<br>
<br>Make sure that you have a &quot;wide&quot; Python build for this, you can test that with:<br>&gt;&gt;&gt; import sys<br>&gt;&gt;&gt; sys.maxunicode<br>1114111<br><br>A narrow build will report 65536.<br>