<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
</head>
<body>
<div>Hi Tom,</div>
<div><br>
</div>
<div>The AS API is UTF-8 by default and AS tries to make sure your database is set up correctly, too, by checking the database/table encodings. As a data point, with dozens of migrations making millions of calls to the AS API and sending data in both directions
 I've yet to come across a single instance of AS inserting spurious characters into API responses, but I've had plenty of encoding issues in the same migrations on the data/database level. I'm fairly confident you'll find the source of those characters <span style="font-family: "Segoe UI WestEuropean", "Segoe UI", Helvetica, Arial, sans-serif;">if
 you look at the raw data.</span></div>
<div><span style="font-family: "Segoe UI WestEuropean", "Segoe UI", Helvetica, Arial, sans-serif;"><br>
</span></div>
<div>p</div>
<div><br>
</div>
<hr style="display:inline-block;width:98%" tabindex="-1">
<div id="divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" style="font-size:11pt" color="#000000"><b>From:</b> archivesspace_users_group-bounces@lyralists.lyrasis.org <archivesspace_users_group-bounces@lyralists.lyrasis.org> on behalf of Tom Hanstra
 <hanstra@nd.edu><br>
<b>Sent:</b> 03 September 2021 18:09<br>
<b>To:</b> Archivesspace Users Group <archivesspace_users_group@lyralists.lyrasis.org><br>
<b>Subject:</b> Re: [Archivesspace_Users_Group] API output - extra unicode</font>
<div> </div>
</div>
<div>
<div dir="ltr">Brian (and others),
<div><br>
</div>
<div>The data in the database should be UTF-8 as far as I can tell. So, I think this has to be happening at the API export level. Is there anything specific that needs to be done to have the API know that this is UTF-8 data?</div>
<div><br>
</div>
<div>Tom</div>
</div>
<br>
<div class="x_gmail_quote">
<div dir="ltr" class="x_gmail_attr">On Fri, Sep 3, 2021 at 11:42 AM Brian Harrington <<a href="mailto:brian.harrington@lyrasis.org">brian.harrington@lyrasis.org</a>> wrote:<br>
</div>
<blockquote class="x_gmail_quote" style="margin:0px 0px 0px 0.8ex; border-left:1px solid rgb(204,204,204); padding-left:1ex">
<div lang="EN-US" style="">
<div class="x_gmail-m_-117656770956461666WordSection1">
<p class="x_MsoNormal">Hi Tom,<u></u><u></u></p>
<p class="x_MsoNormal"><u></u> <u></u></p>
<p class="x_MsoNormal">In my experience \u00c3 appearing in anything is almost always a sign of encoding issues.  I would make sure that everything is UTF-8 all the way through.<u></u><u></u></p>
<p class="x_MsoNormal"><u></u> <u></u></p>
<p class="x_MsoNormal">Brian<u></u><u></u></p>
<p class="x_MsoNormal"><u></u> <u></u></p>
<div style="border-right:none; border-bottom:none; border-left:none; border-top:1pt solid rgb(181,196,223); padding:3pt 0in 0in">
<p class="x_MsoNormal"><b><span style="font-size:12pt; color:black">From: </span>
</b><span style="font-size:12pt; color:black"><<a href="mailto:archivesspace_users_group-bounces@lyralists.lyrasis.org" target="_blank">archivesspace_users_group-bounces@lyralists.lyrasis.org</a>> on behalf of Tom Hanstra <<a href="mailto:hanstra@nd.edu" target="_blank">hanstra@nd.edu</a>><br>
<b>Reply-To: </b>Archivesspace Users Group <<a href="mailto:archivesspace_users_group@lyralists.lyrasis.org" target="_blank">archivesspace_users_group@lyralists.lyrasis.org</a>><br>
<b>Date: </b>Friday, September 3, 2021 at 11:06 AM<br>
<b>To: </b>Archivesspace Users Group <<a href="mailto:archivesspace_users_group@lyralists.lyrasis.org" target="_blank">archivesspace_users_group@lyralists.lyrasis.org</a>><br>
<b>Subject: </b>[Archivesspace_Users_Group] API output - extra unicode<u></u><u></u></span></p>
</div>
<div>
<p class="x_MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="x_MsoNormal"><span style="font-family:Arial,sans-serif">On our local version of ArchivesSpace, we are testing API output and are finding that we are getting extra Unicode characters on export. It looks like the data is right in the database, but doesn't
 quite come out right from the API extract. It looks like there is an extra unicode character added (in some of the code we reviewed, this was either \u00c3 or \u00a2).</span><u></u><u></u></p>
<div>
<p class="x_MsoNormal"><span style="font-family:Arial,sans-serif; color:rgb(29,28,29)"><br>
<br>
</span><u></u><u></u></p>
</div>
<div>
<p class="x_MsoNormal"><span style="font-family:Arial,sans-serif; color:rgb(29,28,29)">Where might we have something set incorrectly?  Where might the extra data be coming from or have been introduced along the way?</span><u></u><u></u></p>
</div>
<div>
<p class="x_MsoNormal"><span style="font-family:Arial,sans-serif; color:rgb(29,28,29)"><br>
<br>
</span><u></u><u></u></p>
</div>
<div>
<p class="x_MsoNormal"><span style="font-family:Arial,sans-serif; color:rgb(29,28,29)">Thanks,</span><u></u><u></u></p>
</div>
<div>
<p class="x_MsoNormal"><span style="font-family:Arial,sans-serif; color:rgb(29,28,29)">Tom</span><u></u><u></u></p>
<div>
<div style="margin-left:6pt; box-sizing:inherit; border:unset; display:flex; border-radius:0.375em">
<p class="x_MsoNormal" style="background:rgb(248,248,248)"><span style="font-size:11.5pt; font-family:Arial,sans-serif; color:rgb(29,28,29)"><br>
<br>
<u></u><u></u></span></p>
</div>
</div>
</div>
<div>
<p class="x_MsoNormal">-- <u></u><u></u></p>
<div>
<div>
<div>
<div>
<div>
<div>
<p class="x_MsoNormal"><b><span style="font-size:9.5pt; font-family:Arial,sans-serif; color:rgb(136,136,136)">Tom Hanstra</span></b><u></u><u></u></p>
</div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<p class="x_MsoNormal"><i><span style="font-size:9.5pt; font-family:Arial,sans-serif; color:rgb(136,136,136)">Sr. Systems Administrator</span></i><span style="font-size:9.5pt; color:rgb(136,136,136)"><u></u><u></u></span></p>
</div>
<div>
<p class="x_MsoNormal"><span style="font-size:9.5pt; color:rgb(136,136,136)"><a href="mailto:hanstra@nd.edu" target="_blank"><span style="font-family:Arial,sans-serif; color:rgb(17,85,204)">hanstra@nd.edu</span></a><u></u><u></u></span></p>
</div>
</div>
<div>
<p class="x_MsoNormal"><span style="font-size:9.5pt; color:rgb(136,136,136)"><u></u> <u></u></span></p>
</div>
</div>
<div>
<p class="x_MsoNormal"><span style="font-size:9.5pt; color:rgb(136,136,136); border:1pt solid windowtext; padding:0in"><img border="0" width="32" height="32" id="x_gmail-m_-117656770956461666_x0000_i1025" alt="Image removed by sender." style="width:0.3333in; height:0.3333in" data-outlook-trace="F:1|T:1" src="cid:9bebc22b-3108-40c4-8027-5a465c8421e8"></span><span style="font-size:9.5pt; color:rgb(136,136,136)"><u></u><u></u></span></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
_______________________________________________<br>
Archivesspace_Users_Group mailing list<br>
<a href="mailto:Archivesspace_Users_Group@lyralists.lyrasis.org" target="_blank">Archivesspace_Users_Group@lyralists.lyrasis.org</a><br>
<a href="http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group" rel="noreferrer" target="_blank">http://lyralists.lyrasis.org/mailman/listinfo/archivesspace_users_group</a><br>
</blockquote>
</div>
<br clear="all">
<div><br>
</div>
-- <br>
<div dir="ltr" class="x_gmail_signature">
<div dir="ltr">
<div>
<div dir="ltr">
<div dir="ltr">
<div><b style="font-family:arial,helvetica,sans-serif; font-size:12.7273px; color:rgb(136,136,136)">Tom Hanstra</b><br>
</div>
<div style="color:rgb(136,136,136); font-size:12.8px">
<div dir="ltr">
<div dir="ltr">
<div dir="ltr">
<div dir="ltr">
<div style="font-size:12.7273px">
<div>
<div><i style="font-size:12.7273px; font-family:arial,helvetica,sans-serif">Sr. Systems Administrator</i></div>
<div><a href="mailto:hanstra@nd.edu" target="_blank" style="color:rgb(17,85,204); font-size:12.7273px; font-family:arial,helvetica,sans-serif">hanstra@nd.edu</a><br>
</div>
</div>
<div><span style="font-family:arial,helvetica,sans-serif"><br>
</span></div>
</div>
<div style="font-size:12.7273px"><img src="https://docs.google.com/uc?export=download&id=1GFX1KaaMTtQ2Kg2u8bMXt1YwBp96bvf0&revid=0B7APN9POn6xAQ244WWFYMFU3aVJwZ0lxbmVHK3FxNXlCd0RRPQ"><br>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</body>
</html>